Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2019049483) SYNONYM DICTIONARY CREATION DEVICE, SYNONYM DICTIONARY CREATION PROGRAM, AND SYNONYM DICTIONARY CREATION METHOD
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2019/049483 International Application No.: PCT/JP2018/024837
Publication Date: 14.03.2019 International Filing Date: 29.06.2018
IPC:
G06F 17/27 (2006.01) ,G06F 17/30 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
20
Handling natural language data
27
Automatic analysis, e.g. parsing, orthograph correction
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
30
Information retrieval; Database structures therefor
Applicants:
株式会社SCREENホールディングス SCREEN HOLDINGS CO., LTD. [JP/JP]; 京都府京都市上京区堀川通寺之内上る四丁目天神北町1番地の1 Tenjinkita-machi 1-1, Teranouchi-agaru 4-chome, Horikawa-dori, Kamigyo-ku, Kyoto-shi, Kyoto 6028585, JP
Inventors:
吉田 明子 YOSHIDA Akiko; JP
粕渕 清孝 KASUBUCHI Kiyotaka; JP
吉和 隆夫 YOSHIWA Takao; JP
山下 義男 YAMASHITA Yoshio; JP
Agent:
吉竹 英俊 YOSHITAKE Hidetoshi; JP
有田 貴弘 ARITA Takahiro; JP
Priority Data:
2017-17388211.09.2017JP
Title (EN) SYNONYM DICTIONARY CREATION DEVICE, SYNONYM DICTIONARY CREATION PROGRAM, AND SYNONYM DICTIONARY CREATION METHOD
(FR) DISPOSITIF DE CRÉATION DE DICTIONNAIRE DE SYNONYMES, PROGRAMME DE CRÉATION DE DICTIONNAIRE DE SYNONYMES ET PROCÉDÉ DE CRÉATION DE DICTIONNAIRE DE SYNONYMES
(JA) 同義語辞書作成装置、同義語辞書作成プログラム及び同義語辞書作成方法
Abstract:
(EN) An objective of the present invention is to carry out a highly precise synonym assessment and automatically generate a synonym dictionary from a text. A morpheme analysis is carried out on a text, the text is segmented into multiple words, and a morpheme-analyzed text is obtained. A topic classification is carried out on the morpheme-analyzed text, at least one topic word associated with each topic is selected from the multiple words, and a reference word characterizing each topic is extracted from at least one of the topic words. The multiple words are multidimensionally vectorized and multiple vectors expressing each of the multiple words are obtained. At least one synonym is selected from the multiple words. At least one of the synonyms is selected such that the similarity between the vector expressing the reference word and the vector expressing each of said at least one synonym exceeds a set reference. A synonym dictionary is created wherein at least a portion of said at least one synonym has been registered.
(FR) Un objectif de la présente invention est de réaliser une évaluation de synonymes très précise et de générer automatiquement un dictionnaire de synonymes à partir d'un texte. Une analyse de morphèmes est effectuée sur un texte, le texte est segmenté en de multiples mots, et un texte analysé de morphèmes est obtenu. Une classification de sujet est effectuée sur le texte analysé par morphèmes, au moins un mot de sujet associé à chaque sujet est sélectionné parmi les multiples mots, et un mot de référence caractérisant chaque sujet est extrait d'au moins l'un des mots de sujet. Les mots multiples sont vectorisés de manière multidimensionnelle et de multiples vecteurs exprimant chacun des mots multiples sont obtenus. Au moins un synonyme est sélectionné parmi les multiples mots. Au moins l'un des synonymes est sélectionné de telle sorte que la similarité entre le vecteur exprimant le mot de référence et le vecteur exprimant chacun dudit synonyme dépasse une référence définie. Un dictionnaire de synonymes est créé, au moins une partie dudit synonyme ayant été enregistrée.
(JA) 高い精度を有する同義語判定を行ってテキストから同義語辞書を自動的に生成する。テキストに対して形態素解析が行われ、テキストが複数の単語に分割され、形態素解析済テキストが得られる。形態素解析済テキストに対してトピック分類が行われ、複数の単語から各トピックに属する少なくともひとつのトピック語が選択され、少なくともひとつのトピック語から各トピックを特徴づける基準語が抽出される。複数の単語が多次元ベクトル化され、複数の単語をそれぞれ表現する複数のベクトルが得られる。複数の単語から少なくともひとつの類似語が選択される。基準語を表現するベクトルと少なくともひとつの類似語の各類似語を表現するベクトルとの間の類似度が設定された基準より高くなるように少なくともひとつの類似語が選択される。少なくともひとつの類似語の少なくとも一部が登録された同義語辞書が作成される。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Japanese (JA)
Filing Language: Japanese (JA)