WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2007143658) EXTRACTION D'ATTRIBUTS ET VALEURS DE DOCUMENTS EN LANGAGE NATUREL
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2007/143658    N° de la demande internationale :    PCT/US2007/070427
Date de publication : 13.12.2007 Date de dépôt international : 05.06.2007
CIB :
G06Q 10/00 (2012.01)
Déposants : ACCENTURE GLOBAL SERVICES GMBH [CH/CH]; Herrenacker 15, CH-8200 Schaffhausen (CH)
Inventeurs : FANO, Andrew E.; (US).
PROBST, Katharina; (US).
GHANI, Rayid; (US).
KREMA, Marko; (US).
LIU, Yan; (US)
Mandataire : MORENO, Christopher P.; Vedder Price Kaufman & Kammholz, 222 N. LaSalle Street, Chicago, Illinois 60601 (US)
Données relatives à la priorité :
60/803,940 05.06.2006 US
11/742,215 30.04.2007 US
11/742,244 30.04.2007 US
Titre (EN) EXTRACTION OF ATTRIBUTES AND VALUES FROM NATURAL LANGUAGE DOCUMENTS
(FR) EXTRACTION D'ATTRIBUTS ET VALEURS DE DOCUMENTS EN LANGAGE NATUREL
Abrégé : front page image
(EN)One or more classification algorithms are applied to at least one natural language document in order to extract both attributes and values of a given product. Supervised classification algorithms, semi-supervised classification algorithms, unsupervised classification algorithms or combinations of such classification algorithms may be employed for this purpose. The at least one natural language document may be obtained via a public communication network. Two or more attributes (or two or more values) thus identified may be merged to form one or more attribute phrases or value phrases. Once attributes and values have been extracted in this manner, association or linking operations may be performed to establish attribute -value pairs that are descriptive of the product. In a presently preferred embodiment, an (unsupervised) algorithm is used to generate seed attributes and values which can then support a supervised or semi-supervised classification algorithm.
(FR)La présente invention concerne un ou plusieurs algorithmes de classification, appliqués à au moins un document en langage naturel afin d'extraire les attributs et les valeurs d'un produit donné. Les algorithmes de classification supervisés, les algorithmes de classification semi-supervisé, les algorithmes de classification non supervisés ou des combinaisons de ces algorithmes de classification peuvent servir dans ce but. Au moins un document en langage naturel peut être obtenu par un réseau de communication public. Deux attributs ou plus (ou deux valeurs ou plus) ainsi identifiés peuvent être fusionnés pour former une ou plusieurs expressions d'attribut ou expressions de valeurs. Une fois que les attributs et les valeurs ont été extraits de cette manière, les opérations d'association ou de liaison peuvent être réalisées de manière à établir des paires attribut-valeur décrivant le produit. Dans un mode de réalisation actuellement préféré, un algorithme (non supervisé) sert à générer des attributs et des valeurs de graine capables de soutenir un algorithme de classification supervisé ou non supervisé.
États désignés : AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, SV, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IS, IT, LT, LU, LV, MC, MT, NL, PL, PT, RO, SE, SI, SK, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)