Processing

Please wait...

Settings

Settings

1. WO2020003928 - ENTITY IDENTIFICATION SYSTEM

Publication Number WO/2020/003928
Publication Date 02.01.2020
International Application No. PCT/JP2019/022218
International Filing Date 04.06.2019
IPC
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
20
Handling natural language data
27
Automatic analysis, e.g. parsing, orthograph correction
[IPC code unknown for G06F 16/383]
G06F 17/27 (2006.01)
G06F 16/383 (2019.01)
CPC
G06F 16/383
Applicants
  • 株式会社NTTドコモ NTT DOCOMO, INC. [JP/JP]; 東京都千代田区永田町二丁目11番1号 11-1, Nagatacho 2-chome, Chiyoda-ku, Tokyo 1006150, JP
Inventors
  • 白水 優太朗 SHIRAMIZU Yutaro; JP
Agents
  • 長谷川 芳樹 HASEGAWA Yoshiki; JP
  • 黒木 義樹 KUROKI Yoshiki; JP
  • 沖山 隆 OKIYAMA Takashi; JP
  • 深石 賢治 FUKAISHI Kenji; JP
Priority Data
2018-12345128.06.2018JP
Publication Language Japanese (JA)
Filing Language Japanese (JA)
Designated States
Title
(EN) ENTITY IDENTIFICATION SYSTEM
(FR) SYSTÈME D'IDENTIFICATION D'ENTITÉ
(JA) エンティティ特定システム
Abstract
(EN)
In the present invention, an entity appropriate to the context of a sentence is identified. An entity identification system 10 comprises: an input unit 11 to which a sentence is input; a phrase extraction unit 12 that extracts one or more phrases from the input sentence; a candidate conversion unit 13 that converts at least one of the extracted phrases to one or more candidate phrases of an entity linked to the phrase; a combination generation unit 14 that generates at least one phrase combination corresponding to the sentence and including each of the converted one or more phrases; a score calculation unit 15 that, for each generated combination, calculates a score on the basis of a similarity score between phrases included in the combination; and an entity identification unit 16 that, on the basis of the calculated combination score, identifies an entity phrase to be linked, from the one or more candidate phrases.
(FR)
La présente invention concerne l'identification d'une entité appropriée au contexte d'une phrase. Un système d'identification d'entité (10) comprend : une unité d'entrée (11) vers laquelle une phrase est entrée ; une unité d'extraction de phrase (12) qui extrait une ou plusieurs phrases de la phrase d'entrée ; une unité de conversion en candidate (13) qui convertit au moins l'une des phrases extraites en une ou plusieurs phrases candidates d'une entité liée à la phrase ; une unité de génération de combinaison (14) qui génère au moins une combinaison de phrases correspondant à la phrase et comprenant chacune desdites phrases converties ; une unité de calcul de score (15) qui, pour chaque combinaison générée, calcule un score en fonction d'un score de similarité entre des phrases comprises dans la combinaison ; et une unité d'identification d'entité (16) qui, en fonction du score de combinaison calculé, identifie une phrase d'entité à relier, à partir desdites phrases candidates.
(JA)
文章の文脈に適したエンティティを特定する。 エンティティ特定システム10は、文章を入力する入力部11と、入力された文章から1つ以上の語句を抽出する語句抽出部12と、抽出された語句のうち少なくとも何れかについて、当該語句にリンクされるエンティティの1つ以上の候補の語句に変換する候補変換部13と、変換された1つ以上の語句の何れかをそれぞれ含む、文章に対応する語句の組み合わせを1つ以上生成する組み合わせ生成部14と、生成された各組み合わせについて、組み合わせに含まれる語句同士の類似性のスコアに基づいてスコアを算出するスコア算出部15と、算出された組み合わせのスコアに基づいて、1つ以上の候補の語句から、リンクされるエンティティの語句を特定するエンティティ特定部16とを備える。
Latest bibliographic data on file with the International Bureau