WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO1996008787) SYSTEM AND METHOD FOR AUTOMATIC SUBCHARACTER UNIT AND LEXICON GENERATION FOR HANDWRITING RECOGNITION
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/1996/008787    International Application No.:    PCT/US1995/011815
Publication Date: 21.03.1996 International Filing Date: 14.09.1995
Chapter 2 Demand Filed:    19.03.1996    
IPC:
G06K 9/62 (2006.01)
Applicants: APPLE COMPUTER, INC. [US/US]; One Infinite Loop, Cupertino, CA 95014 (US)
Inventors: LEE, Kai-Fu; (US).
CHOW, Yen-Lu; (US).
GRAJSKI, Kamil; (US)
Agent: FERRELL, John, S.; Carr, DeFilippo & Ferrell, Suite 200, 2225 East Bayshore Road, Palo Alto, CA 94303 (US)
Priority Data:
08/306,016 14.09.1994 US
Title (EN) SYSTEM AND METHOD FOR AUTOMATIC SUBCHARACTER UNIT AND LEXICON GENERATION FOR HANDWRITING RECOGNITION
(FR) SYSTEME ET PROCEDE DE GENERATION AUTOMATIQUE D'UNITES DE SOUS-CARACTERES ET DE LEXIQUE POUR LA RECONNAISSANCE DE L'ECRITURE MANUSCRITE
Abstract: front page image
(EN)A system for automatic subcharacter unit and lexicon generation for handwriting recognition comprises a processing unit, a handwriting input device, and a memory wherein a segmentation unit, a subcharacter generation unit, a lexicon unit, and a modeling unit reside. The segmentation unit generates feature vectors corresponding to sample characters. The subcharacter generation unit clusters feature vectors and assigns each feature vector associated with a given cluster an identical label. The lexicon unit constructs a lexical graph for each character in a character set. The modeling unit generates a Hidden Markov Model for each set of identically-labeled feature vectors. After a first set of lexical graphs and Hidden Markov Models have been created, the subcharacter generation unit determines for each feature vector which Hidden Markov Model produces a highest likelihood value. The subcharacter generation unit relabels each feature vector according to the highest likelihood value, after which the lexicon unit and the modeling unit generate a new set of lexical graphs and a new set of Hidden Markov Models, respectively. The feature vector relabeling, lexicon generation, and Hidden Markov Model generation are performed iteratively until a convergence criterion is met. The final set of Hidden Markov Model model parameters provide a set of subcharacter units for handwriting recognition, where the subcharacter units are derived from information inherent in the sample characters themselves.
(FR)Système de génération automatique d'unités de sous-caractères et de lexique pour la reconnaissance de l'écriture manuscrite, qui comprend une unité de traitement, un dispositif de saisie de données manuscrites et une mémoire qui contient une unité de segmentation, une unité de génération de sous-caractères et une unité de modélisation. L'unité de segmentation génère des vecteurs de caractéristiques correspondant à des caractères échantillons. L'unité de génération de sous-caractères groupe des vecteurs de caractéristiques et attribue à chaque vecteur associé à un groupe donné une étiquette identique. L'unité de lexique construit un graphique lexical pour chaque caractère dans une série de caractères. L'unité de modélisation génère un modèle de Markov caché pour chaque série de vecteurs à étiquettes identiques. Après la création d'une première série de graphiques lexicaux et de modèles de Markov cachés, l'unité de génération de sous-caractères détermine pour chaque vecteur de caractéristique le modèle de Markov caché qui produit la valeur de vraisemblance la plus élevée. L'unité de génération de sous-caractères réétiquette chaque vecteur de caractéristique selon la valeur de vraisemblance la plus élevée, après quoi l'unité de lexique et l'unité de modélisation génèrent une nouvelle série de graphiques lexicaux et une nouvelle série de modèles de Markov cachés, respectivement. Le réétiquetage des vecteurs de caractéristiques, la génération de lexique et la génération du modèle de Markov caché sont effectués itérativement jusqu'à ce qu'un critère de convergence soit obtenu. La série finale de paramètres de modèles du modèle de Markov caché fournit une série d'unités de sous-caractères pour la reconnaissance d'écriture manuscrite, lesdites unités de sous-caractères étant dérivées d'informations inhérentes aux caractères échantillons eux-mêmes.
Designated States: AM, AT, AU, BB, BG, BR, BY, CA, CH, CN, CZ, DE, DK, EE, ES, FI, GB, GE, HU, IS, JP, KE, KG, KP, KR, KZ, LK, LR, LT, LU, LV, MD, MG, MN, MW, MX, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, TJ, TM, TT, UA, UG, UZ, VN.
African Regional Intellectual Property Organization (KE, MW, SD, SZ, UG)
European Patent Office (AT, BE, CH, DE, DK, ES, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)