WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2014173882) PROCÉDÉ ET DISPOSITIF D'EXTRACTION AUTOMATIQUE DE THÈMES À PARTIR D'AU MOINS UN DOCUMENT CONTENANT DU TEXTE
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2014/173882    N° de la demande internationale :    PCT/EP2014/058110
Date de publication : 30.10.2014 Date de dépôt international : 22.04.2014
CIB :
G06F 17/30 (2006.01), G06F 17/27 (2006.01)
Déposants : THALES [FR/FR]; 45 rue de Villiers F-92200 Neuilly Sur Seine (FR)
Inventeurs : DUQUEROIE, Bertrand; (FR).
GOUJON, Bénédicte; (FR)
Mandataire : BLOT, Philippe; Cabinet Lavoix 2, place d'Estienne d'Orves F-75009 Paris (FR)
Données relatives à la priorité :
13 00948 23.04.2013 FR
Titre (EN) METHOD AND DEVICE FOR AUTOMATICALLY EXTRACTING THEMES FROM AT LEAST ONE DOCUMENT CONTAINING TEXT
(FR) PROCÉDÉ ET DISPOSITIF D'EXTRACTION AUTOMATIQUE DE THÈMES À PARTIR D'AU MOINS UN DOCUMENT CONTENANT DU TEXTE
Abrégé : front page image
(EN)The invention relates to a method for automatically extracting themes from at least one document containing text, in the form of a hierarchized representative graph, a node of said graph being representative of a theme dealt with in said text, and corresponding to a category extracted from a hierarchized knowledge base comprising descriptions of themes by categories linked by links of relationship over a plurality of hierarchical levels. The method comprises extraction (60, 62) of a set of keywords of said at least one text, followed by the obtaining (66, 68, 72) of a hierarchized complete graph representative of said at least one text by extracting the totality of categories of the hierarchized knowledge base corresponding to the extracted set of keywords, said hierarchized complete graph comprising parent nodes having at least one descendant and descendantless nodes termed leaf nodes, said leaf nodes corresponding to said keywords. Thereafter, a simplification (74) of the complete graph is applied, comprising a simplification processing based on the structure of the graph to be simplified, so as to obtain a hierarchized representative graph.
(FR)L'invention concerne un procédé d'extraction automatique de thèmes à partir d'au moins un document contenant du texte, sous forme d'un graphe représentatif hiérarchisé, un nœud dudit graphe étant représentatif d'un thème abordé dans ledit texte, et correspondant à une catégorie extraite d'une base de connaissances hiérarchisée comprenant des descriptions de thèmes par catégories liées par des liens de parenté sur une pluralité de niveaux hiérarchiques. Le procédé comporte une extraction (60,62) d'un ensemble de mots clés dudit au moins un texte, suivi de l'obtention (66, 68, 72) d'un graphe complet hiérarchisé représentatif dudit au moins un texte par extraction de la totalité des catégories de la base de connaissances hiérarchisée correspondant à l'ensemble des mots clés extrait, ledit graphe complet hiérarchisé comprenant des nœuds parents ayant au moins un descendant et des nœuds sans descendant dits nœuds feuilles, lesdits nœuds feuilles correspondant auxdits mots clés. Ensuite, une simplification (74) du graphe complet est appliquée, comprenant un traitement de simplification basé sur la structure du graphe à simplifier, pour obtenir un graphe représentatif hiérarchisé.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : français (FR)
Langue de dépôt : français (FR)