WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2002029617) METHOD, APPARATUS, AND SYSTEM FOR BUILDING A COMPACT MODEL FOR LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION (LVCSR) SYSTEM
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2002/029617    International Application No.:    PCT/CN2000/000306
Publication Date: 11.04.2002 International Filing Date: 30.09.2000
IPC:
G06F 17/20 (2006.01)
Applicants: INTEL CORPORATION (a corporation of Delaware) [US/US]; 2200 Mission College Boulevard, Santa Clara, CA 95052 (US) (For All Designated States Except US).
PAN, Jielin [CN/CN]; (CN) (For US Only).
YUAN, Baosheng [SG/SG]; (SG) (For US Only)
Inventors: PAN, Jielin; (CN).
YUAN, Baosheng; (SG)
Agent: CCPIT PATENT AND TRADEMARK LAW OFFICE; 8th floor, 2 Fuchengmenwai St., Beijing 100037 (CN)
Priority Data:
Title (EN) METHOD, APPARATUS, AND SYSTEM FOR BUILDING A COMPACT MODEL FOR LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION (LVCSR) SYSTEM
(FR) PROCEDE, APPAREIL ET SYSTEME PERMETTANT DE CREER UN MODELE COMPACT UTILISE AVEC UN SYSTEME DE RECONNAISSANCE VOCALE EN CONTINU A VOCABULAIRE ELARGI (LVCSR)
Abstract: front page image
(EN)According to one aspect of the invention, a method is provided in which a mean vector set and a variance vector set of a set of N Gaussians are divided into multiple mean sub-vector sets and variance sub-vector sets, respectively. Each mean sub-vector set contains a subset of the dimensions of the corresponding mean vector set and each variance sub-vector set contains a subset of the dimensions of the corresponding variance vector set. Each resultant sub-vector set is clustered to build a codebook for the respective sub-vector set using a modified K-means clustering process which dynamically merges and splits clusters based upon the size and average distortion of each cluster during each iteration in the modified K-means clustering process.
(FR)Selon un aspect de cette invention, on met en oeuvre un procédé consistant à diviser un jeu de vecteurs moyens et un jeu de vecteurs de variance d'un jeu de N valeurs gaussienne en de multiples jeux de sous-vecteurs moyens et de jeux de sous-vecteurs de variance. Chaque jeu de sous-vecteurs moyens comporte un sous-ensemble des dimensions du jeu de vecteurs moyens correspondant et chaque jeu de sous-vecteurs de variance comporte, à son tour, un sous-ensemble des dimensions du jeu de vecteurs de variance correspondant. Chaque jeu de sous-vecteurs obtenu est groupé de manière à former un livre des codes pour le jeu de sous-vecteurs correspondant. A cet effet on utilise la technique du groupe des K-moyennes modifiées qui fusionne et partage des groupes de manière dynamique en fonction de leur dimension et de la distorsion moyenne de chaque groupe survenant lors de chaque itération dans le processus de groupement des K-moyennes modifiées.
Designated States: AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CR, CU, CZ, DE, DK, DM, DZ, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, TZ, UA, UG, US, UZ, VN, YU, ZA, ZW.
African Regional Intellectual Property Organization (GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)