WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2003079221) A METHOD AND SYSTEM FOR NAMING A CLUSTER OF WORDS AND PHRASES
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2003/079221    International Application No.:    PCT/US2003/007372
Publication Date: 25.09.2003 International Filing Date: 10.03.2003
IPC:
G06F 17/27 (2006.01), G06F 17/30 (2006.01)
Applicants: VERITY, INC. [US/US]; 894 Ross Drive Sunnyvale, CA 94089 (US)
Inventors: MAO, Jianchang; (US).
TAANK, Sumit; (US).
CHUNG, Chistina; (US).
ALPHA, Luk; (US)
Agent: BOTJER, William, L.; P.O. Box 478 Center Moriches, NY 11934 (US)
Priority Data:
10/096,048 12.03.2002 US
Title (EN) A METHOD AND SYSTEM FOR NAMING A CLUSTER OF WORDS AND PHRASES
(FR) PROCEDE ET SYSTEME PERMETTANT D'ATTRIBUER UN NOM A UN GROUPE DE MOTS ET DE PHRASES
Abstract: front page image
(EN)The invention provides a method for naming a cluster, of words and phrases that have been extracted from a set of documents. It takes these clusters as the input (101) and generates appropiate labels (109) for the clusters using a lexical database. Naming invloved first finding all word sense (102) for all the word in the cluster, using the lexical database; and then augmenting each word sense with words that are semantically similar to that word sense to form respective definition vectors (103). Theafter word sense disambiguation is done to find out the most relevant sense of each word (104). Definiiton vectors are clustered into groups (step 105). Each group represent a concept (106).
(FR)L'invention concerne un procédé permettant d'attribuer un nom à un groupe de mots et de phrases ayant été extrait d'un ensemble de documents. Le procédé traite ces groupes comme l'entrée (101) et génère des étiquettes appropriées (109) destinées aux groupes, au moyen d'une base de données lexicale. L'attribution de nom consiste, dans un premier temps, à trouver tous les sens des mots (102) pour tous les mots dans le groupe, au moyen de la base de données lexicale ; et puis à développer chaque sens des mots au moyen de mots qui sont similaires sur le plan sémantique aux sens des mots, de manière à former des vecteurs de définition respectifs (103). Puis une désambiguation des sens des mots est exécutée, de manière à déterminer le sens le plus pertinent de chaque mot (104). Des vecteurs de définition sont groupés (étape 105). Chaque groupe représente un concept (106).
Designated States: AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NO, NZ, OM, PH, PL, PT, RO, RU, SD, SE, SG, SK, SL, TJ, TM, TN, TR, TT, TZ, UA, UG, UZ, VN, YU, ZA, ZM, ZW.
African Regional Intellectual Property Organization (GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IT, LU, MC, NL, PT, RO, SE, SI, SK, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)