WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2001084357) CLUSTER AND PRUNING-BASED LANGUAGE MODEL COMPRESSION
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2001/084357    International Application No.:    PCT/US2001/010536
Publication Date: 08.11.2001 International Filing Date: 31.03.2001
Chapter 2 Demand Filed:    26.11.2001    
IPC:
G06F 17/27 (2006.01), G06F 17/28 (2006.01)
Applicants: MICROSOFT CORPORATION [US/US]; One Microsoft Way Redmond, WA 98052 (US)
Inventors: GOODMAN, Joshua, T.; (US).
GAO, Jianfeng; (CN)
Agent: KELLY, Joseph R.; Westman, Champlin & Kelly, P.A. Suite 1600 - International Centre 900 Second Avenue South Minneapolis, MN 55402-3319 (US)
Priority Data:
09/565,608 04.05.2000 US
Title (EN) CLUSTER AND PRUNING-BASED LANGUAGE MODEL COMPRESSION
(FR) COMPRESSION DE MODELE LINGUISTIQUE BASEE SUR LE GROUPAGE ET L'ELAGAGE
Abstract: front page image
(EN)Cluster- and pruning-based language model compression is disclosed. In one embodiment, a language model is first clustered, such as by using predictive clustering. The language model after clustering has a largersize than it did before clustering. The language model is then pruned, such as by using entropy-based techniques, such as Rosenfeld pruning, or by using Stolcke pruning or count-cutoff techniques. In one particular embodiment, a word language model is first predictively clustered by a technique described as P(Z|xy) x P(z|xyZ), where a lower-case letter refers to a word, and an upper-cluster letter refers to a cluster in which the word resides.
(FR)L'invention concerne une compression de modèle linguistique basée sur le groupage et l'élagage. Dans un mode de réalisation, un modèle linguistique est d'abord groupé, au moyen du groupage prédictif par exemple. Le modèle linguistique après groupage possède une taille supérieure qu'avant groupage. Le modèle est ensuite élagué, au moyen de techniques basées sur l'entropie par exemple, telles que l'élagage Rosenfeld, l'élagage Stolcke ou des techniques d'élagage de comptages. Dans un mode de réalisation particulier, un modèle linguistique de mots est d'abord groupé de manière prédictive par une technique décrite par P(Z|xy) x P(z|xyZ), où une lettre en minuscule désigne un mot, et une lettre à groupe supérieur désigne un groupe dans lequel se trouve le mot.
Designated States: AE, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, CA, CH, CN, CR, CU, CZ, DE, DK, DM, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, TZ, UA, UG, UZ, VN, YU, ZA, ZW.
African Regional Intellectual Property Organization (GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)