WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2014204338) METHODS AND SYSTEMS THAT USE A HIERARCHICALLY ORGANIZED DATA STRUCTURE CONTAINING STANDARD FEATURE SYMBOLS IN ORDER TO CONVERT DOCUMENT IMAGES TO ELECTRONIC DOCUMENTS
Latest bibliographic data on file with the International Bureau   

Pub. No.: WO/2014/204338 International Application No.: PCT/RU2013/000515
Publication Date: 24.12.2014 International Filing Date: 18.06.2013
IPC:
G06K 9/00 (2006.01) ,G06K 9/68 (2006.01) ,G06K 9/72 (2006.01)
Applicants: ABBYY DEVELOPMENT LLC[RU/RU]; ul. Otradnaya, 2B, str. 6, of. 7-01 Moscow, 127273, RU
Inventors: CHULININ, Yury Georgievich; RU
Agent: PATENT AGENCY "ERMAKOVA, STOLIAROVA & ASSOCIATION"; Shmitovsky pr., 2, str. /2 Moscow, 123100, RU
Priority Data:
Title (EN) METHODS AND SYSTEMS THAT USE A HIERARCHICALLY ORGANIZED DATA STRUCTURE CONTAINING STANDARD FEATURE SYMBOLS IN ORDER TO CONVERT DOCUMENT IMAGES TO ELECTRONIC DOCUMENTS
(FR) PROCÉDÉS ET SYSTÈMES UTILISANT UNE STRUCTURE DE DONNÉES ORGANISÉE HIÉRARCHIQUEMENT CONTENANT DES SYMBOLES D'ENTITÉS STANDARD AFIN DE CONVERTIR DES IMAGES DE DOCUMENTS EN DOCUMENTS ÉLECTRONIQUES
Abstract: front page image
(EN) The current application is directed to methods and systems that convert document images, which contain Arabic text and text in other languages in which symbols are joined together to produce continuous words and portions of words, into corresponding electronic documents. In one implementation, a document-image-processing method and system to which the current application is directed employs numerous techniques and features that render efficiently computable an otherwise intractable or impractical document-image-to-electronic-document conversion. These techniques and features include transformation of text-image morphemes and words into feature symbols with associated parameters, efficiently identifying similar morphemes and words in an electronic store of standard-feature-symbol-encoded morphemes and words, and identifying candidate inter-character division points and corresponding traversal paths using the similar morphemes and words identified in the word store.
(FR) La présente invention concerne des procédés et des systèmes qui convertissent des images de documents, contenant du texte arabe et du texte dans d'autres langues où des symboles sont joints entre eux pour produire des mots continus et des parties de mots, en documents électroniques correspondants. Dans un mode de réalisation, un procédé et un système de traitement d'images de documents selon la présente invention emploient de nombreuses techniques et fonctionnalités qui rendent possible un calcul efficient d'une conversion d'image de document en document électronique qui serait autrement intraitable ou difficilement faisable. Parmi ces techniques et fonctionnalités figure la transformation de morphèmes d'image de texte et de mots en symboles d'entités auxquels sont associés des paramètres, l'identification efficiente de morphèmes et de mots similaires dans un catalogue électronique de morphèmes et de mots codés par symboles d'entités standard, et l'identification de points de division candidats entre caractères et de trajets de parcours correspondants utilisant les morphèmes et mots similaires identifiés dans le catalogue de mots.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)