WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2018067184) AUTOMATING CREATION OF ACCURATE OCR TRAINING DATA USING SPECIALIZED UI APPLICATION
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.:    WO/2018/067184    International Application No.:    PCT/US2016/056263
Publication Date: 12.04.2018 International Filing Date: 10.10.2016
IPC:
B07C 3/18 (2006.01), G06F 7/00 (2006.01), G06F 17/24 (2006.01), G06K 9/00 (2006.01), G06K 9/34 (2006.01), G06K 9/48 (2006.01), G06K 9/66 (2006.01)
Applicants: INTUIT INC. [US/US]; 2700 Coast Avenue Mountain View, California 94043 (US)
Inventors: KRIVOPALTSEV, Eugene; (US).
MADDIKA, Sreeneel K.; (US).
YELLAPRAGADA, Vijay S.; (US)
Agent: PATTERSON, B. Todd; (US).
STEWART, Jon K.; (US)
Priority Data:
15/285,552 05.10.2016 US
Title (EN) AUTOMATING CREATION OF ACCURATE OCR TRAINING DATA USING SPECIALIZED UI APPLICATION
(FR) AUTOMATISATION DE CRÉATION DE DONNÉES D'ENTRAÎNEMENT DE ROC PRÉCISES UTILISANT UNE APPLICATION D'UI SPÉCIALISÉE
Abstract: front page image
(EN)Systems of the present disclosure generate accurate training data for optical character recognition (OCR). Systems disclosed herein generates images of a text passage as displayed piecemeal in a user interface (UI) element rendered in a selected font type and size, determine accurate dimensions and locations of bounding boxes for each character pictured in the images, stitch together a training image by concatenating the images, and associate the training image, the bounding box dimensions and locations, and the text passage together in a collection of training data. The collection of training data also includes a computer-readable master copy of the text passage with newline characters inserted therein.
(FR)Des systèmes de la présente invention produisent des données d'entraînement précises pour la reconnaissance optique de caractères (ROC). Des systèmes décrits dans la présente invention produisent des images d'un passage de texte sous forme de fragments affichés dans un élément d'interface utilisateur (UI) représentés avec un type et une taille de police sélectionnés, déterminent des dimensions et des emplacements précis de rectangles englobants pour chaque caractère représenté dans les images, assemblent une image d'entraînement en concaténant les images, et associent l'image d'entraînement, les dimensions et emplacements de rectangle englobant, et le passage de texte dans une collection de données d'entraînement. La collection de données d'entraînement comprend également une copie maîtresse lisible par ordinateur du passage de texte avec des caractères de fin de ligne insérés dedans.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)