Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Tuesday 25.01.2022 at 9:00 AM CET
Settings

Settings

Goto Application

1. WO2021234799 - DATA PROCESSING DEVICE, DATA PROCESSING METHOD, AND DATA PROCESSING PROGRAM

Publication Number WO/2021/234799
Publication Date 25.11.2021
International Application No. PCT/JP2020/019700
International Filing Date 18.05.2020
IPC
G06F 40/295 2020.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
279Recognition of textual entities
289Phrasal analysis, e.g. finite state techniques or chunking
295Named entity recognition
CPC
G06F 40/295
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
279Recognition of textual entities
289Phrasal analysis, e.g. finite state techniques or chunking
295Named entity recognition
Applicants
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
Inventors
  • 須永 聡 SUNAGA, Satoshi
  • 菊間 一宏 KIKUMA, Kazuhiro
Agents
  • 特許業務法人酒井国際特許事務所 SAKAI INTERNATIONAL PATENT OFFICE
Priority Data
Publication Language Japanese (ja)
Filing Language Japanese (JA)
Designated States
Title
(EN) DATA PROCESSING DEVICE, DATA PROCESSING METHOD, AND DATA PROCESSING PROGRAM
(FR) DISPOSITIF DE TRAITEMENT DE DONNÉES, PROCÉDÉ DE TRAITEMENT DE DONNÉES ET PROGRAMME DE TRAITEMENT DE DONNÉES
(JA) データ処理装置、データ処理方法及びデータ処理プログラム
Abstract
(EN) This data processing device (10) comprises: an extraction unit (152) which extracts morphemes of a specific part of speech and part of speech type, from part-of-speech information and part-of-speech-type information that is an analysis result obtained by morphological analysis of document data; a candidate compound word generation unit (153) which generates, as a candidate compound word, a word obtained by concatenating the morphemes extracted by the extraction unit (152); and a determination unit (154) which finds whether the candidate compound word completely matches an entry word from Japanese dictionary electronic dictionary data, determines that the candidate compound is not terminology in the case of complete match, and determines that the candidate compound is terminology in the case of incomplete match.
(FR) Ce dispositif de traitement de données (10) comprend : une unité d'extraction (152) qui extrait des morphèmes d'une partie spécifique de la parole et d'une partie de type de parole, à partir d'informations de partie de parole et d'informations de type de partie de parole qui sont un résultat d'analyse obtenu par analyse morphologique de données de document ; une unité de génération de mot composé candidat (153) qui génère, en tant que mot composé candidat, un mot obtenu par concaténation des morphèmes extraits par l'unité d'extraction (152) ; et une unité de détermination (154), qui recherche si le mot composé candidat correspond complètement au mot d'entrée des données de dictionnaire électronique japonais, détermine que le composé candidat n'est pas une terminologie dans le cas de correspondance complète, et détermine que le composé candidat est une terminologie dans le cas de correspondance incomplète.
(JA) データ処理装置(10)は、文書データに対する形態素解析によって得られた解析結果である品詞情報及び品詞種類情報から、特定の品詞かつ品詞種類の形態素を抽出する抽出部(152)と、抽出部(152)によって抽出された形態素をつなぎ合わせた語を複合語候補として生成する複合語候補生成部(153)と、複合語候補が国語辞典電子辞書データの見出し語に完全一致するか否かを検索し、完全一致した場合には複合語候補が専門用語ではないと判定し、完全一致しない場合には複合語候補が専門用語であると判定する判定部(154)と、を有する。
Latest bibliographic data on file with the International Bureau