WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2011153392) ENRICHISSEMENT SÉMANTIQUE PAR EXPLOITATION DE TRAITEMENT TOP-K
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2011/153392    N° de la demande internationale :    PCT/US2011/038991
Date de publication : 08.12.2011 Date de dépôt international : 03.06.2011
CIB :
G06F 7/00 (2006.01)
Déposants : THOMSON LICENSING [FR/FR]; 1-5 rue Jeanne d'Arc F-92130 Issy-les-Moulineaux (FR) (Tous Sauf US).
KIM, Jong, Wook [KR/US]; (US) (US Seulement).
KASHYAP, Ashwin, S. [IN/US]; (US) (US Seulement).
LI, Dekai [CN/US]; (US) (US Seulement).
BHAMIDIPATI, Sandilya [IN/US]; (US) (US Seulement).
PATEL, Bankim, A. [US/US]; (US) (US Seulement).
SRIDHAR, Avinash [IN/US]; (US) (US Seulement).
MATHUR, Saurabh [IN/US]; (US) (US Seulement)
Inventeurs : KIM, Jong, Wook; (US).
KASHYAP, Ashwin, S.; (US).
LI, Dekai; (US).
BHAMIDIPATI, Sandilya; (US).
PATEL, Bankim, A.; (US).
SRIDHAR, Avinash; (US).
MATHUR, Saurabh; (US)
Mandataire : SHEDD, Robert, D.; Thomson Licensing LLC Two Independence Way Suite 200 Princeton, NJ 08540 (US)
Données relatives à la priorité :
61/351,252 03.06.2010 US
61/397,780 17.06.2010 US
61/456,774 13.11.2010 US
Titre (EN) SEMANTIC ENRICHMENT BY EXPLOITING TOP-K PROCESSING
(FR) ENRICHISSEMENT SÉMANTIQUE PAR EXPLOITATION DE TRAITEMENT TOP-K
Abrégé : front page image
(EN)Proper representation of the meaning of texts is crucial to enhancing many data mining and information retrieval tasks, including clustering, computing semantic relatedness between texts, and searching. Representing of texts in the concept-space derived from Wikipedia has received growing attention recently, due to its comprehensiveness and expertise. This concept-based representation is capable of extracting semantic relatedness between texts that cannot be deduced with the bag of words model. A key obstacle, however, for using Wikipedia as a semantic interpreter is that the sheer size of the concepts derived from Wikipedia makes it hard to efficiently map texts into concept-space. An efficient algorithm is proved which is able to represent the meaning of a text by using the concepts that best match it. In particular, this approach first computes the approximate top- concepts that are most relevant to the given text. These concepts are then leverage to represent the meaning of the given text.
(FR)La représentation correcte de la signification de textes est cruciale pour renforcer de nombreuses tâches de récupération d'informations et d'exploration de données, comprenant le regroupement, le calcul de la relation sémantique entre textes, et la recherche. La représentation de textes dans l'espace concept dérivé de Wikipédia a reçu de plus en plus d'attention récemment, en raison de son caractère exhaustif et de son expertise. Cette représentation à base de concept est capable d'extraire une relation sémantique entre textes qui ne peut pas être déduite avec le modèle du sac de mots. Un obstacle clé, toutefois, dans l'utilisation de Wikipédia en tant qu'interpréteur sémantique est que la taille brute des concepts dérivés de Wikipédia rend difficile la cartographie efficace des textes dans l'espace concept. Un algorithme efficace est prouvé, lequel est capable de représenter la signification d'un texte en utilisant les concepts qui y correspondent au mieux. En particulier, cette approche calcule en premier lieu les meilleurs concepts approximatifs qui sont le plus pertinents pour le texte donné. Ces concepts sont ensuite exploités par effet de levier pour représenter la signification du texte donné.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PE, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)