Processing

Please wait...

Settings

Settings

1. WO2020009045 - otsu-gram USING DELAYED MEMORY MATRIX

Publication Number WO/2020/009045
Publication Date 09.01.2020
International Application No. PCT/JP2019/025992
International Filing Date 29.06.2019
IPC
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
10
Complex mathematical operations
16
Matrix or vector computation
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
20
Handling natural language data
27
Automatic analysis, e.g. parsing, orthograph correction
G06F 17/16 (2006.01)
G06F 17/27 (2006.01)
CPC
G06F 17/16
Applicants
  • 新妻弘崇 NIITSUMA Hirotaka [JP/JP]; JP
Inventors
  • 新妻弘崇 NIITSUMA Hirotaka; JP
Priority Data
2018-12643003.07.2018JP
Publication Language Japanese (JA)
Filing Language Japanese (JA)
Designated States
Title
(EN) otsu-gram USING DELAYED MEMORY MATRIX
(FR) otsu-gram UTILISANT UNE MATRICE DE MÉMOIRE RETARDÉE
(JA) 遅延メモリ行列を用いたotsu-gram
Abstract
(JA)
【課題】 自然言語処理などで時系列データの特徴量として良く利用されるn-gramにおいてnを職人芸で調節しないといけない問題を解決し、自動的に適切な特徴が選択されるotsu-gramを提案する。この特徴量にcorrespondence analysisを適用すると単語分散表現が計算できる。この単語分散表現は従来法のword2vecやfasteTextよりも大幅に精度向上したものになる。しかし、この特徴量と単語分散表現の計算には非常に大きなメモリが必要となり計算が困難である。 【解決手段】 n-gramのnを職人芸で調節しないといけない問題を大津の2値化でnを調節することで解決した。この特徴の計算でメモリが大量に必要になる部分を遅延評価にして少ないメモリでの計算を可能とした。データの一部をディスクに保存することで少ないメモリで高速に計算する方法も提案する。このメモリ効率向上手法は他の疎行列演算にも応用できる応用範囲の広いテクニックである。
Latest bibliographic data on file with the International Bureau