WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2007140386) apprentissage des modÈles syntaxiques pour une dÉcouverte automatique des relations causales À partir d'un texte
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2007/140386    N° de la demande internationale :    PCT/US2007/069926
Date de publication : 06.12.2007 Date de dépôt international : 30.05.2007
CIB :
G06F 17/21 (2006.01)
Déposants : HONDA MOTOR CO., LTD. [JP/JP]; 2-1-1 Minami Aoyama, Minato-ku Tokyo, 107-8556 (JP) (Tous Sauf US).
GUPTA, Rakesh [US/US]; (US) (US Seulement)
Inventeurs : GUPTA, Rakesh; (US)
Mandataire : BANAIT, Narinder, S.; Fenwick & West Llp, Silicon Valley Center, 801 California Street, Mountain View, CA 94041 (US)
Données relatives à la priorité :
60/809,780 30.05.2006 US
11/754,966 29.05.2007 US
Titre (EN) LEARNING SYNTACTIC PATTERNS FOR AUTOMATIC DISCOVERY OF CAUSAL RELATIONS FROM TEXT
(FR) apprentissage des modÈles syntaxiques pour une dÉcouverte automatique des relations causales À partir d'un texte
Abrégé : front page image
(EN)The present invention provides a method for extracting relationships between words in textual data. Initially, training relationship data, such as word triplets describing a cause- effect relationship, is received and used to collect additional textual data including the training relationship data. Distributed data collection is used to receive the training data and collect the additional textual data, allowing a broad range of data to be acquired from multiple sources. Syntactic patterns are extracted from the additional textual data and a distributed data source is scanned to extract additional relationship data describing one or more causal relationships using the extracted syntactic patterns. The extracted additional relationship data is then stored, and can be validated by a supervised learning algorithm before storage and used to train a classifier for automatic validation of additional relationship data.
(FR)La présente invention concerne un procédé pour extraire des relations entre des mots dans des données textuelles. Initialement, des données de relations de formation, telles que des triplés de mots décrivant une relation cause- effet, sont reçues et utilisées pour collecter des données textuelles additionnelles comprenant les données de relations de formation. Une collecte de données distribuées est utilisée pour recevoir les données de formation et collecter les données textuelles additionnelles, permettant à un registre important de données d'être acquis à partir de sources multiples. Des modèles syntaxiques sont extraits des données textuelles additionnelles et une source de données distribuées est analysée pour extraire des données de relations additionnelles décrivant une ou plusieurs relations causales à l'aide des modèles syntaxiques extraits. Les données de relations additionnelles extraites sont ensuite stockées, et peuvent être validées par un algorithme d'apprentissage supervisé avant le stockage et servir à former un classificateur pour la validation automatique des données de relations additionnelles.
États désignés : AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, SV, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IS, IT, LT, LU, LV, MC, MT, NL, PL, PT, RO, SE, SI, SK, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)