WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2015113635) OPTICAL CHARACTER RECOGNITION
Latest bibliographic data on file with the International Bureau   

Pub. No.: WO/2015/113635 International Application No.: PCT/EP2014/051961
Publication Date: 06.08.2015 International Filing Date: 31.01.2014
IPC:
G06K 9/62 (2006.01)
Applicants: LONGSAND LIMITED[GB/GB]; Autonomy House Cambridge Business Park Cowley Road Cambridge Cambridgeshire CB4 0WZ, GB
Inventors: BLANCHFLOWER, Sean; GB
Agent: EIP; Fairfax House 15 Fulwood Place London WC1V 6HU, GB
Priority Data:
Title (EN) OPTICAL CHARACTER RECOGNITION
(FR) RECONNAISSANCE OPTIQUE DE CARACTÈRES
Abstract: front page image
(EN) Optical character recognition is described in various implementations. In one example implementation, a method may include receiving a plurality of optical character recognition (OCR) outputs provided by a respective plurality of OCR engines, each of the plurality of OCR outputs being representative of text depicted in a portion of an electronic image. The method may also include identifying a document context associated with the electronic image, and generating an output character set by applying a character resolution model to resolve differences among the plurality of OCR outputs. The character resolution model may define a probability of character recognition accuracy for each of the plurality of OCR engines given the identified document context. The method may also include updating the character resolution model to generate an updated character resolution model such that subsequent generating of output character sets are based on the updated character resolution model.
(FR) Selon divers modes de réalisation, l'invention porte sur la reconnaissance optique de caractères. Dans un mode de réalisation donné à titre d'exemple, un procédé peut comprendre la réception d'une pluralité de sorties de reconnaissance optique de caractères (OCR) fournies par une pluralité de moteurs d'OCR respectifs, chacune de ces sorties d'OCR étant représentative d'un texte qui se trouve dans une partie d'une image électronique. Le procédé peut également inclure l'identification du contexte du document associé à l'image électronique, et la génération d'un ensemble de caractères de sortie par application d'un modèle de résolution de caractères pour résoudre les différences entre la pluralité de sorties d'OCR. Ledit modèle de résolution de caractères peut définir la probabilité de l'exactitude de la reconnaissance de caractères pour chacun des moteurs d'OCR au vu du contexte du document identifié. Le procédé peut aussi impliquer l'actualisation du modèle de résolution de caractères afin de générer un modèle de résolution de caractères actualisé, de manière à ce que la future génération d'ensembles de caractères de sortie soit basée sur le modèle de résolution de caractères actualisé.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)