WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2014003543) PROCÉDÉ, SYSTÈME ET PROGRAMME INFORMATIQUE DE GÉNÉRATION D'UNE REPRÉSENTATION DE REQUÊTE D'UN DOCUMENT ET DE DEMANDE À UN SYSTÈME DE RÉCUPÉRATION DE DOCUMENT À L'AIDE DE LADITE REPRÉSENTATION DE REQUÊTE
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2014/003543    N° de la demande internationale :    PCT/NL2012/050463
Date de publication : 03.01.2014 Date de dépôt international : 29.06.2012
Demande présentée en vertu du Chapitre 2 :    26.02.2014    
CIB :
G06F 17/30 (2006.01)
Déposants : SOPHEON N.V. [NL/NL]; Kantoorgebouw OFFICIA 1 De Boelelaan 7 NL-1083 HJ Amsterdam (NL) (Tous Sauf US).
RUTTEN, Hubert Joseph Marie [NL/NL]; (NL) (US Seulement).
KLEYNENBERG, Steven Ernst [NL/NL]; (NL) (US Seulement).
TEN PAS, Elsemiek [NL/NL]; (NL) (US Seulement)
Inventeurs : RUTTEN, Hubert Joseph Marie; (NL).
KLEYNENBERG, Steven Ernst; (NL).
TEN PAS, Elsemiek; (NL)
Mandataire : Mertens, H.V.; P.O. Box 3241 NL-2280 GE Rijswijk (NL)
Données relatives à la priorité :
Titre (EN) METHOD, SYSTEM AND COMPUTER PROGRAM FOR GENERATING A QUERY REPRESENTATION OF A DOCUMENT, AND QUERYING A DOCUMENT RETRIEVAL SYSTEM USING SAID QUERY REPRESENTATION
(FR) PROCÉDÉ, SYSTÈME ET PROGRAMME INFORMATIQUE DE GÉNÉRATION D'UNE REPRÉSENTATION DE REQUÊTE D'UN DOCUMENT ET DE DEMANDE À UN SYSTÈME DE RÉCUPÉRATION DE DOCUMENT À L'AIDE DE LADITE REPRÉSENTATION DE REQUÊTE
Abrégé : front page image
(EN)In a method and system of generating a query representation of an electronic query document, the query document is processed by a computer processor. The computer processor is configured to identify words and sentences in the query document, generate for each word a corresponding part-of-speech, POS, category of the word, identify each sequence of words having a predetermined sequence of POS categories, and store the identified sequences of words as the query representation of the query document. In a method and system for querying a document retrieval system, the document retrieval system is queried with a plurality of the stored identified sequences of words; and target documents are retrieved from the document retrieval system. The target documents have at least one sequence of words in common with the query document. In a method and system for clustering similar documents in a set of electronic documents, one document of the set of documents is designated as a query document. The query document is processed to store identified sequences of words as a query representation of the query document. Each remaining one of the set of documents is queried with a plurality of the stored identified sequences of words. A similarity value for each query of a remaining one of the set of documents is determined, and documents in the set of documents are clustered based on the similarity values.
(FR)L'invention concerne un procédé et un système de génération d'une représentation de requête d'un document de requête électronique, dans lesquels le document de requête est traité par un processeur informatique. Le processeur informatique est configuré pour identifier des mots et des phrases dans le document de requête, générer pour chaque mot une catégorie correspondante de partie de discours (POS), identifier chaque séquence de mots ayant une séquence prédéfinie de catégories POS et stocker les séquences de mots identifiées comme représentation de requête du document de requête. Dans un procédé et un système de requête à un système de récupération de documents, le système de récupération de document reçoit une requête avec une pluralité des séquences de mots identifiées et stockées ; et les documents cible sont récupérés par le système de récupération de documents. Les documents cible ont au moins une séquence de mots en commun avec le document de requête. Dans un procédé et un système de regroupement de documents similaires dans un ensemble de documents électroniques, un document dans l'ensemble de documents est désigné comme un document de requête. Le document de requête est traité, de manière à stocker les séquences de mots identifiées sous forme de représentation de requête du document de requête. Chacun des documents restants dans l'ensemble de documents reçoit une requête avec une pluralité des séquences de mots identifiées et stockées. Une valeur de similitude pour chaque requête d'un document restant parmi l'ensemble de documents est déterminée et les documents dans l'ensemble de documents sont regroupés sur la base des valeurs de similitude.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)