Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

1. WO2007140386 - apprentissage des modÈles syntaxiques pour une dÉcouverte automatique des relations causales À partir d'un texte

Numéro de publication WO/2007/140386
Date de publication 06.12.2007
N° de la demande internationale PCT/US2007/069926
Date du dépôt international 30.05.2007
CIB
G06F 17/21 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
20Manipulation de données en langage naturel
21Traitement de texte
CPC
G06F 40/20
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
Déposants
  • HONDA MOTOR CO., LTD. [JP/JP]; 2-1-1 Minami Aoyama Minato-ku Tokyo, 107-8556, JP (AllExceptUS)
  • GUPTA, Rakesh [US/US]; US (UsOnly)
Inventeurs
  • GUPTA, Rakesh; US
Mandataires
  • BANAIT, Narinder, S. ; Fenwick & West Llp Silicon Valley Center 801 California Street Mountain View, CA 94041, US
Données relatives à la priorité
11/754,96629.05.2007US
60/809,78030.05.2006US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) LEARNING SYNTACTIC PATTERNS FOR AUTOMATIC DISCOVERY OF CAUSAL RELATIONS FROM TEXT
(FR) apprentissage des modÈles syntaxiques pour une dÉcouverte automatique des relations causales À partir d'un texte
Abrégé
(EN)
The present invention provides a method for extracting relationships between words in textual data. Initially, training relationship data, such as word triplets describing a cause- effect relationship, is received and used to collect additional textual data including the training relationship data. Distributed data collection is used to receive the training data and collect the additional textual data, allowing a broad range of data to be acquired from multiple sources. Syntactic patterns are extracted from the additional textual data and a distributed data source is scanned to extract additional relationship data describing one or more causal relationships using the extracted syntactic patterns. The extracted additional relationship data is then stored, and can be validated by a supervised learning algorithm before storage and used to train a classifier for automatic validation of additional relationship data.
(FR)
La présente invention concerne un procédé pour extraire des relations entre des mots dans des données textuelles. Initialement, des données de relations de formation, telles que des triplés de mots décrivant une relation cause- effet, sont reçues et utilisées pour collecter des données textuelles additionnelles comprenant les données de relations de formation. Une collecte de données distribuées est utilisée pour recevoir les données de formation et collecter les données textuelles additionnelles, permettant à un registre important de données d'être acquis à partir de sources multiples. Des modèles syntaxiques sont extraits des données textuelles additionnelles et une source de données distribuées est analysée pour extraire des données de relations additionnelles décrivant une ou plusieurs relations causales à l'aide des modèles syntaxiques extraits. Les données de relations additionnelles extraites sont ensuite stockées, et peuvent être validées par un algorithme d'apprentissage supervisé avant le stockage et servir à former un classificateur pour la validation automatique des données de relations additionnelles.
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international