Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2019041527) METHOD OF EXTRACTING CHART IN DOCUMENT, ELECTRONIC DEVICE AND COMPUTER-READABLE STORAGE MEDIUM
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2019/041527 International Application No.: PCT/CN2017/108810
Publication Date: 07.03.2019 International Filing Date: 31.10.2017
IPC:
G06F 17/25 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
20
Handling natural language data
21
Text processing
25
Automatic justification
Applicants:
平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN/CN]; 中国广东省深圳 福田区八卦岭八卦三路平安大厦吴东勤 Wu, Dongqin Ping An Building, Bagua 3rd Road Bagualing, Futian District Shenzhen, Guangdong 518000, CN
Inventors:
王鸿滨 WANG, HongBin; CN
王晓伟 WANG, XiaoWei; CN
汪伟 WANG, Wei; CN
肖京 XIAO, Jing; CN
Agent:
深圳市沃德知识产权代理事务所(普通合伙) SHENZHEN WORLD INTELLECTUAL PROPERTY AGENCY (GENERAL PARTNERSHIP ); 中国广东省深圳 福田区园岭街道八卦四路10号中浩大厦1528-1530室于志光 Yu, Zhiguang, Room 1528-1530 Zhonghao Building, No.10 of Bagua Fourth Road Yuanling Street, Futian District Shenzhen, Guangdong 518000, CN
Priority Data:
201710776354.931.08.2017CN
Title (EN) METHOD OF EXTRACTING CHART IN DOCUMENT, ELECTRONIC DEVICE AND COMPUTER-READABLE STORAGE MEDIUM
(FR) PROCÉDÉ D'EXTRACTION D'UN GRAPHIQUE DANS UN DOCUMENT, DISPOSITIF ÉLECTRONIQUE ET SUPPORT D'INFORMATIONS LISIBLE PAR ORDINATEUR
(ZH) 文档图表抽取方法、电子设备及计算机可读存储介质
Abstract:
(EN) A method of extracting a chart in a document. The method comprises: acquiring position information of all texts in a specified document (S31); for each page of the specified document, generating a blank image of the same size as that of the page of the specified document, then converting, according to the position information of all the texts in the page, all the texts in the page into pixel points in the blank image and rendering the blank image (S32); and marking a blank area in the rendered image to be a candidate chart area, and extracting chart information from the candidate chart area to be a chart extracted from the page of the specified document (S33). The above method can improve the efficiency and coverage of chart extraction.
(FR) La présente invention concerne un procédé d'extraction d'un graphique dans un document. Le procédé comprend les étapes consistant : à acquérir des informations de position de tous les textes dans un document spécifié (S31) ; pour chaque page du document spécifié, à générer une image vierge de la même taille que la page du document spécifié, à convertir ensuite, conformément aux informations de position de tous les textes dans la page, tous les textes dans la page en points de pixel dans l'image vierge et à rendre l'image vierge (S32) ; et à marquer une zone vierge dans l'image rendue à être une zone de graphique candidate, et à extraire des informations de graphique à partir de la zone de graphique candidate devant être un graphique extrait de la page du document spécifié (S33). Le procédé peut améliorer l'efficacité et la couverture d'extraction de graphique.
(ZH) 一种文档图表抽取方法,该方法包括步骤:获取指定文档中所有文字的位置信息(S31);针对该指定文档中的每张页面,生成一张与该指定文档页面相同大小的空白图片,然后根据该页面中所有文字的位置信息,将该页面中所有文字转换为该空白图片中的像素点,并对该空白图片进行渲染(S32);将所述渲染后的图片中的空白区域标记为候选图表区域,并从该候选图表区域中抽取图表信息,作为该指定文档页面抽取出的图表(S33)。上述方法可以提升图表抽取的效率和覆盖面。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)