Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018040342) METHOD AND DEVICE FOR IDENTIFYING TEXT AREA IN IMAGE
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/040342 International Application No.: PCT/CN2016/108419
Publication Date: 08.03.2018 International Filing Date: 02.12.2016
IPC:
G06K 9/20 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
K
RECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9
Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
20
Image acquisition
Applicants:
百度在线网络技术(北京)有限公司 BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) CO., LTD. [CN/CN]; 中国北京市 海淀区上地十街10号百度大厦三层 3/F Baidu Campus No. 10, Shangdi 10th Street Haidian District Beijing 100085, CN
Inventors:
陈鑫 CHEN, Xin; CN
高建忠 GAO, Jianzhong; CN
雷成军 LEI, Chengjun; CN
吴冬雪 WU, Dongxue; CN
杨琳琳 YANG, Linlin; CN
程涛远 CHENG, Taoyuan; CN
Agent:
北京英赛嘉华知识产权代理有限责任公司 INSIGHT@INSIGHTIP.COM; 中国北京市 海淀区知春路甲48号盈都大厦A座19A 19 A, Tower A, InDo Building No. 48A Zhichun Road, Haidian District Beijing 100098, CN
Priority Data:
201610794963.231.08.2016CN
Title (EN) METHOD AND DEVICE FOR IDENTIFYING TEXT AREA IN IMAGE
(FR) PROCÉDÉ ET DISPOSITIF D'IDENTIFICATION D'UNE ZONE DE TEXTE DANS UNE IMAGE
(ZH) 用于识别图像中文字区域的方法和装置
Abstract:
(EN) Disclosed are a method and device for identifying a text area in an image. One particular embodiment of the method comprises: acquiring colour values and position information about various pixel points in an image to be identified (201); based on the colour values of various pixel points, clustering the pixel points (202), wherein the colour values of the pixel points in each pixel point type are the same or similar; with regard to each type of pixel point after being clustered, determining a profile of each connected region formed by the pixel points in the type of pixel point so as to obtain a profile set (203); and based on the colour values and position information about various profiles in the profile set, combining various profiles so as to obtain various text areas in the image (204). The embodiment improves the accuracy of text line sequence identification in image and text identification.
(FR) La présente invention concerne un procédé et un dispositif d'identification d'une zone de texte dans une image. Un mode de réalisation particulier du procédé comprend les étapes consistant à : obtenir des valeurs de couleurs et des informations sur les positions relatives à divers points de pixels dans une image devant être identifiée (201) ; regrouper les points de pixels sur la base des valeurs de couleurs des divers points de pixels (202), les valeurs de couleurs des points de pixels de chaque type de points de pixels étant identiques ou similaires ; pour chaque type de points de pixels regroupés, déterminer un profil de chaque région associée formé par les points de pixels dans le type de points de pixels de façon à obtenir un ensemble de profils (203) ; et, sur la base des valeurs de couleurs et des informations sur les positions relatives aux divers profils dans l'ensemble de profils, combiner divers profils de façon à obtenir diverses zones de texte dans l'image (204). Le mode de réalisation accroît la précision d'une identification d'une séquence de lignes de texte dans une image et d'une identification d'un texte.
(ZH) 用于识别图像中文字区域的方法和装置。所述方法的一具体实施方式包括:获取待识别的图像中的各个像素点的颜色值和位置信息(201);基于所述各个像素点的颜色值,对所述像素点进行聚类(202),其中每个像素点类别中的像素点的颜色值相同或相似;针对聚类处理后的每类像素点,确定由该类像素点中的像素点构成的各个连通区域的轮廓,得到轮廓集合(203);基于所述轮廓集合中的各个轮廓的颜色值和位置信息,对所述各个轮廓进行合并,以得到所述图像中的各个文字区域(204)。该实施方式提高了图像文字识别中文字行顺序识别的准确率。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)