Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020096770 - SUPERVISED OCR TRAINING FOR CUSTOM FORMS

Publication Number WO/2020/096770
Publication Date 14.05.2020
International Application No. PCT/US2019/057509
International Filing Date 23.10.2019
IPC
G06K 9/00 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
G06K 9/72 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
72using context analysis based on the provisionally recognised identity of a number of successive patterns, e.g. a word
Applicants
  • MICROSOFT TECHNOLOGY LICENSING, LLC [US]/[US]
Inventors
  • FLORENCIO, Dinei Afonso Ferreira
  • ZHANG, Cha
  • NAHMIAS, Gil Moshe
  • DAI, Yu-Yun
Agents
  • MINHAS, Sandip S.
  • CHEN, Wei-Chen Nicholas
  • HINOJOSA-SMITH, Brianna L.
  • SWAIN, Cassandra T.
  • WONG, Thomas S.
  • CHOI, Daniel
  • HWANG, William C.
  • WIGHT, Stephen A.
  • CHATTERJEE, Aaron C.
  • JARDINE, John S.
  • GOLDSMITH, Micah P.
  • TRAN, Kimberly
  • ADJEMIAN, Monica
  • BARKER, Doug
  • CHURNA, Timothy
  • DINH, Phong
  • EVANS, Patrick
  • GABRYJELSKI, Henry
  • GUPTA, Anand
  • LEE, Sunah
  • LEMMON, Marcus
  • MARQUIS, Thomas
  • MEYERS, Jessica
  • ROPER, Brandon
  • SPELLMAN, Steven
  • SULLIVAN, Kevin
  • TABOR, Ben
  • WALKER, Matt
  • WISDOM, Gregg
  • WONG, Ellen
  • ZHANG, Hannah
Priority Data
16/185,73709.11.2018US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) SUPERVISED OCR TRAINING FOR CUSTOM FORMS
(FR) APPRENTISSAGE D'OCR SUPERVISÉ POUR FORMULAIRES SPÉCIAUX
Abstract
(EN)
The disclosed technology is generally directed to optical character recognition for forms. In one example of the technology, optical character recognition is performed on a plurality of forms. The forms of the plurality of forms include at least one type of form. Anchors are determined for the forms, including corresponding anchors for each type of form of the plurality of forms. Feature rules are determined, including corresponding feature rules for each type of form of the plurality of forms. Features and labels are determined for each form of the plurality of forms. A training model is generated based on a ground truth that includes a plurality of key-value pairs corresponding to the plurality of forms, and further based on the determined features and labels for the plurality of forms.
(FR)
La présente invention concerne généralement la reconnaissance optique de caractères pour des formulaires. Dans un exemple de la technologie, une reconnaissance optique de caractères est effectuée sur une pluralité de formulaires. Les formulaires de la pluralité de formulaires comprennent au moins un type de formulaire. Des ancres sont déterminées pour les formulaires, y compris des ancres correspondantes pour chaque type de formulaire de la pluralité de formulaires. Des règles de caractéristiques sont déterminées, y compris des règles de caractéristiques correspondantes pour chaque type de formulaire de la pluralité de formulaires. Des caractéristiques et des étiquettes sont déterminées pour chaque formulaire de la pluralité de formulaires. Un modèle d'apprentissage est généré sur la base d'une réalité de terrain qui comprend une pluralité de paires de valeurs clefs qui correspondent à la pluralité de formes, et en outre sur la base des caractéristiques et des étiquettes déterminées pour la pluralité de formulaires.
Also published as
Latest bibliographic data on file with the International Bureau