WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Options
Langue d'interrogation
Stemming/Racinisation
Trier par:
Nombre de réponses par page
Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2018022162) RECONNAISSANCE OPTIQUE DE CARACTÈRES DANS DES DOCUMENTS STRUCTURÉS
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2018/022162 N° de la demande internationale : PCT/US2017/030671
Date de publication : 01.02.2018 Date de dépôt international : 02.05.2017
CIB :
G06K 9/00 (2006.01) ,G06K 9/62 (2006.01)
G PHYSIQUE
06
CALCUL; COMPTAGE
K
RECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9
Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
G PHYSIQUE
06
CALCUL; COMPTAGE
K
RECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9
Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
62
Méthodes ou dispositions pour la reconnaissance utilisant des moyens électroniques
Déposants : INTUIT INC.[US/US]; 2700 Coast Avenue Mountain View, California 94043, US
Inventeurs : YELLAPRAGADA, Vijay; US
CHIANG, Peijun; US
MADDIKA, Sreeneel K.; US
Mandataire : PATTERSON, B. Todd; US
STEWART, Jon K.; US
Données relatives à la priorité :
15/219,88826.07.2016US
Titre (EN) OPTICAL CHARACTER RECOGNITION IN STRUCTURED DOCUMENTS
(FR) RECONNAISSANCE OPTIQUE DE CARACTÈRES DANS DES DOCUMENTS STRUCTURÉS
Abrégé :
(EN) Techniques are disclosed for facilitating optical character recognition (OCR) by identifying one or more regions in an electronic document to perform the OCR. For example a method for identifying information in an electronic document includes obtaining a set of training documents for each template of a plurality of templates for the electronic document, extracting spatial attributes for at least a first label region and at least a first corresponding value region from the set, and training a classifier model based on the extracted spatial attributes, wherein the classifier model is used to identify the information in the electronic document. The spatial attributes represent a position of at least the first label region and at least the first value region within the electronic document.
(FR) L'invention concerne des techniques conçues pour faciliter une reconnaissance optique de caractères (OCR) en identifiant une ou plusieurs régions dans un document électronique afin de procéder à l'OCR. Un procédé d'identification d'informations dans un document électronique comprend par exemple les étapes consistant à : obtenir un ensemble de documents de formation pour chaque modèle d'une pluralité de modèles relatifs au document électronique ; extraire de l'ensemble des attributs spatiaux associés à au moins une première région d'étiquettes et à au moins une première région de valeurs correspondantes ; et former un modèle de classificateur sur la base des attributs spatiaux extraits. Le modèle de classificateur sert à identifier les informations dans le document électronique. Les attributs spatiaux représentent une position de ladite au moins une première région d'étiquettes et de ladite au moins une première région de valeurs dans le document électronique.
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)