WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2008125495) PROCÉDÉ ET SYSTÈME AMÉLIORÉS POUR TROUVER LE CENTRE D'INTÉRÊT D'UN DOCUMENT
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2008/125495    N° de la demande internationale :    PCT/EP2008/053927
Date de publication : 23.10.2008 Date de dépôt international : 02.04.2008
CIB :
G06F 17/27 (2006.01)
Déposants : INTERNATIONAL BUSINESS MACHINES CORPORATION [US/US]; New Orchard Road, Armonk, New York 10504 (US) (Tous Sauf US).
IBM UNITED KINGDOM LIMITED [GB/GB]; PO Box 41, North Harbour, Portsmouth Hampshire PO6 3AU (GB) (MG only).
TROUSSOV, Alexander [RU/IE]; (IE) (US Seulement).
SOGRIN, Mikhail [RU/IE]; (IE) (US Seulement).
NAKAYAMA, Akihiro [JP/JP]; (JP) (US Seulement).
JUDGE, John [IE/IE]; (IE) (US Seulement)
Inventeurs : TROUSSOV, Alexander; (IE).
SOGRIN, Mikhail; (IE).
NAKAYAMA, Akihiro; (JP).
JUDGE, John; (IE)
Mandataire : GASCOYNE, Belinda; IBM United Kingdom Limited, Intellectual Property Law, Hursley Park, Winchester Hampshire SO21 2JN (GB)
Données relatives à la priorité :
07106352.3 17.04.2007 EP
Titre (EN) A METHOD AND SYSTEM FOR FINDING A FOCUS OF A DOCUMENT
(FR) PROCÉDÉ ET SYSTÈME AMÉLIORÉS POUR TROUVER LE CENTRE D'INTÉRÊT D'UN DOCUMENT
Abrégé : front page image
(EN)A method and apparatus for finding the focus of a document are provided. A semantic network comprising a plurality of nodes, each representing a concept, and links, connecting the nodes, representing relations between the concepts is used. The method comprises the steps of providing a list of terms in an input document which match concepts represented by the semantic network, as well as a frequency value for each matched term indicating the number of times the term appears in the document; mapping each matched term to a referent node or to a plurality of possible referent nodes in the semantic network, and assigning weights to nodes. Assigning weights to nodes comprises carrying out the following steps for each matched term. Selecting one of the referent nodes as a start node; assigning the start node an initial weight depending on the frequency value of the term; carrying out a depth- first traversal of the semantic network, and then repeating these steps for a next referent node for the term. The depth- first traversal starts from the start node, and at each node in the traversal calculates a weight of the current node based on the weight of the previous node in the traversal and a stepping factor, with the search backtracking to previous nodes when the weight of a current node is found to be less than a predefined weight threshold. These steps are repeated for the next matched term. Then, the weights for each node from all traversals are added together and a focus of the input document is determined by identifying the node having the heaviest weight. The focus can then be used to carry out disambiguation of any ambiguous matched terms. The method can be repeated to find one or more additional foci to enable further disambiguation of terms.
(FR)L'invention concerne un procédé et un système permettant de trouver le centre d'intérêt d'un document. Un réseau sémantique est utilisé, qui comprend plusieurs nœuds représentant chacun une notion, des liens reliant les nœuds et représentant des relations entre les notions. Le procédé consiste à: fournir dans un document d'entrée une liste de termes correspondant à des notions représentées par le réseau sémantique et, pour chaque terme mis en correspondance, une valeur d'occurrence indiquant le nombre de fois où le terme apparaît dans le document; appliquer chaque terme mis en correspondance à un nœud de référence ou à plusieurs nœuds de référence possibles dans le réseau sémantique; et attribuer des poids aux nœuds. L'attribution de poids aux nœuds consiste à mettre en oeuvre les étapes suivantes pour chaque terme mis en correspondance: choisir un des nœuds de référence comme nœud de départ; attribuer un poids initial au nœud de départ en fonction de la valeur d'occurrence du terme; effectuer une traversée en profondeur d'abord du réseau sémantique, puis répéter ces étapes pour le nœud de référence suivant pour le terme. La traversée en profondeur d'abord commence par le nœud de départ et, à chaque nœud de la traversée, calcule un poids du nœud présent sur la base du poids du nœud précédent et d'un facteur de progression, avec retour en arrière aux nœuds précédents lorsqu'il est établi que le poids du nœud présent est inférieur à un seuil pondéral préétabli. Ces étapes sont répétées pour le terme mis en correspondance suivant. Puis, pour chaque traversée, les poids de chaque nœud sont additionnés et un centre d'intérêt du document d'entrée est déterminé par identification du nœud présentant le poids le plus lourd. Le centre d'intérêt peut ensuite être utilisé pour désambiguïser un quelconque terme mis en correspondance présentant une ambiguïté. Le procédé de l'invention peut être répété en vue de trouver un ou plusieurs centres d'intérêt supplémentaires permettant une désambiguïsation plus poussée des termes.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, SV, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MT, NL, NO, PL, PT, RO, SE, SI, SK, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)