WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2005017698) COOCCURRENCE ET CONSTRUCTIONS
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2005/017698    N° de la demande internationale :    PCT/US2004/026297
Date de publication : 24.02.2005 Date de dépôt international : 11.08.2004
CIB :
G06F 17/21 (2006.01), G09B 11/00 (2006.01)
Déposants : EDUCATIONAL TESTING SERVICE [US/US]; Rosedale Road, Princeton, NJ 08540 (US) (Tous Sauf US).
DEANE, Paul [US/US]; (US) (US Seulement)
Inventeurs : DEANE, Paul; (US)
Mandataire : MELNIK, W., Joseph; Pepper Hamilton LLP, One Mellon Center, 50th Floor, 500 Grant Street, Pittsburgh, PA 15219 (US)
Données relatives à la priorité :
60/494,181 11.08.2003 US
Titre (EN) COOCCURRENCE AND CONSTRUCTIONS
(FR) COOCCURRENCE ET CONSTRUCTIONS
Abrégé : front page image
(EN)A method and system for performing automatic text analysis is described. A local ranking for one or more contexts with respect to a word and a global ranking for one or more contexts are generated. The rankings are based on the frequency with which the contexts appear in a corpus. A statistic may be generated using the local and global rankings, such as a log ratio rank statistic equal to the logarithm of the global rank divided by local rank, to measure the similarity of contexts with respect to words with which they combine. A source matrix of word to context values is then created. Singular value decomposition is used to create sub-matrices from the source matrix. Vectors from the sub-matrices corresponding to context(s) and/or word(s) are then selected to determine term-term or context-context similarity or term-context correspondence.
(FR)La présente invention concerne un procédé et un système permettant d'effectuer une analyse de texte automatique. Un classement local pour un ou plusieurs contextes par rapport à un mot et un classement global pour un ou plusieurs contextes sont générés. Ces classements sont fondés sur la fréquence avec laquelle les contextes apparaissent dans un corpus. Une statistique peut-être générée au moyen des classements local et global, telle qu'une statistique de classement de rapport de logarithme égal au logarithme du classement global divisé par le classement local, de façon à mesurer la similarité de contextes par rapport à des mots avec lesquels ils se combinent. Une matrice source de valeurs de mots sur contextes est ensuite créée. Une décomposition de valeur singulière est utilisée pour créer des sous matrices à partir de cette matrice source. Des vecteurs de ces sous matrices correspondant à des contextes et/ou à des mots sont ensuite sélectionnés de façon à déterminer des similarités terme-terme ou contexte-contexte ou des correspondances terme-contexte..
États désignés : AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BW, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NA, NI, NO, NZ, OM, PG, PH, PL, PT, RO, RU, SC, SD, SE, SG, SK, SL, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, YU, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IT, LU, MC, NL, PL, PT, RO, SE, SI, SK, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)