Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2010026804 - DISPOSITIF DE COLLATIONNEMENT APPROXIMATIF, PROCÉDÉ DE COLLATIONNEMENT APPROXIMATIF, PROGRAMME ET SUPPORT D'ENREGISTREMENT

Numéro de publication WO/2010/026804
Date de publication 11.03.2010
N° de la demande internationale PCT/JP2009/059215
Date du dépôt international 19.05.2009
CIB
G06F 17/30 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30Recherche documentaire; Structures de bases de données à cet effet
G06F 17/21 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
20Manipulation de données en langage naturel
21Traitement de texte
CPC
G06F 40/242
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
237Lexical tools
242Dictionaries
Déposants
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP] (AllExceptUS)
  • 齋藤 邦子 SAITO, Kuniko [JP]/[JP] (UsOnly)
  • 今村 賢治 IMAMURA, Kenji [JP]/[JP] (UsOnly)
  • 菊井 玄一郎 KIKUI, Genichiro [JP]/[JP] (UsOnly)
  • 松尾 義博 MATSUO, Yoshihiro [JP]/[JP] (UsOnly)
Inventeurs
  • 齋藤 邦子 SAITO, Kuniko
  • 今村 賢治 IMAMURA, Kenji
  • 菊井 玄一郎 KIKUI, Genichiro
  • 松尾 義博 MATSUO, Yoshihiro
Mandataires
  • 伊東 忠彦 ITOH Tadahiko
Données relatives à la priorité
2008-22838205.09.2008JP
Langue de publication japonais (JA)
Langue de dépôt japonais (JA)
États désignés
Titre
(EN) APPROXIMATE COLLATION DEVICE, APPROXIMATE COLLATION METHOD, PROGRAM, AND RECORDING MEDIUM
(FR) DISPOSITIF DE COLLATIONNEMENT APPROXIMATIF, PROCÉDÉ DE COLLATIONNEMENT APPROXIMATIF, PROGRAMME ET SUPPORT D'ENREGISTREMENT
(JA) 近似照合装置、近似照合方法、プログラム及び記録媒体
Abrégé
(EN)
Keywords can be extracted at high speed even if wrongly written words, skipped-character words, expressions a little different from expected keywords are contained in an inputted character string and the number of keywords is large.  A skip dictionary creating unit (10) creates a skip dictionary containing the keywords to be extracted and listed in the keyword dictionary and a set of deletion keywords made by deleting at least one character in every character position from each keyword and stores the skip dictionary in a skip dictionary storage unit (20).  A keyword extracting unit (30) collates an inputted character string with the words in the skip dictionary, extracts a preliminarily-given keyword and keywords approximate to the keyword from the inputted character string, and outputs them along with the appearance positions.
(FR)
Selon l'invention, des mots-clés peuvent être extraits à grande vitesse même si des mots mal orthographiés, des mots avec lettres manquantes, des expressions légèrement différentes des mots-clés attendus sont contenus dans une chaîne de caractères d'entrée et le nombre de mots-clés est grand. Une unité de création de dictionnaire à saut (10) crée un dictionnaire à saut contenant les mots-clés devant être extraits et listés dans le dictionnaire de mots-clés et un ensemble de mots-clés à suppression formés par suppression d'au moins un caractère dans chaque position de caractère à partir de chaque mot-clé et stocke le dictionnaire à saut dans une unité de stockage de dictionnaire à saut (20). Une unité d'extraction de mot-clé (30) collationne une chaîne de caractères d'entrée avec les mots contenus dans le dictionnaire à saut, extrait un mot-clé donné au préalable et des mots-clés approchant le mot-clé à partir de la chaîne de caractères d'entrée, et les délivre conjointement avec les positions d'apparition.
(JA)
 本発明は、誤字や脱字、想定したキーワードと少し異なる表現が入力文字列に含まれ、抽出したいキーワード数が多い場合であっても、高速に抽出可能とすることを課題とする。その課題を解決するために、スキップ辞書作成部10により、抽出したいキーワードとして予めリストアップされたキーワード辞書について、キーワードそのものと、当該キーワードの全ての文字位置から少なくとも1つの文字を削除した文字列の集合とからなる削除キーワードを含むスキップ辞書を作成してスキップ辞書記憶部20に格納し、キーワード抽出部30により、入力文字列と前記スキップ辞書とを照合することにより、入力文字列から予め与えられたキーワード及び当該キーワードに近似したキーワードを抽出し、その出現位置とともに出力する。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international