Search International and National Patent Collections
Some content of this application is unavailable at the moment.
If this situation persists, please contact us atFeedback&Contact
1. (WO2017130434) COMPUTER SYSTEM, METHOD, AND PROGRAM FOR TRANSFERRING NAMED ENTITY RECOGNITION MODEL FOR MULTIPLE LANGUAGES
Latest bibliographic data on file with the International Bureau

Pub. No.: WO/2017/130434 International Application No.: PCT/JP2016/068565
Publication Date: 03.08.2017 International Filing Date: 22.06.2016
IPC:
G06F 17/27 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
20
Handling natural language data
27
Automatic analysis, e.g. parsing, orthograph correction
Applicants:
楽天株式会社 RAKUTEN, INC. [JP/JP]; 東京都世田谷区玉川一丁目14番1号 1-14-1 Tamagawa, Setagaya-ku, Tokyo 1580094, JP
Inventors:
萩原 正人 HAGIWARA Masato; JP
ジリクリー アヤー ZIRIKLY Ayah; JP
Agent:
長谷川 芳樹 HASEGAWA Yoshiki; JP
Priority Data:
62/28810928.01.2016US
Title (EN) COMPUTER SYSTEM, METHOD, AND PROGRAM FOR TRANSFERRING NAMED ENTITY RECOGNITION MODEL FOR MULTIPLE LANGUAGES
(FR) SYSTÈME INFORMATIQUE, PROCÉDÉ ET PROGRAMME DE TRANSFERT DE MODÈLE DE RECONNAISSANCE D'ENTITÉ NOMMÉE POUR DE MULTIPLES LANGUES
(JA) 多言語の固有表現認識モデルの転移を行うコンピュータシステム、方法、およびプログラム
Abstract:
(EN) A named entity recognition system for multiple languages according to one embodiment includes an obtaining unit that obtains an annotated source language sample and a target language sample, a first producing unit that produces a named entity recognition model for the annotated source language by applying conditional random field sequence labeling to the annotated source language sample and thus obtaining an optimum weighting for each named entity in the annotated source language, a calculating unit that calculates a similarity between the annotated source language sample and the target language sample, and a second producing unit that produces a named entity recognition model for the target language on the basis of the named entity recognition model for the annotated source language and the similarity.
(FR) Un système de reconnaissance d'entités nommées pour de multiples langues selon un mode de réalisation de l'invention comprend une unité d'obtention qui obtient un échantillon de langue source annotée et un échantillon de langue cible, une première unité de production qui produit un modèle de reconnaissance d'entité nommée pour la langue source annotée en appliquant un étiquetage de séquence de champ aléatoire conditionnel à l'échantillon de langue source annotée et pour obtenir ainsi une pondération optimale pour chaque entité nommée dans la langue source annotée, une unité de calcul qui calcule une similitude entre l'échantillon de langue source annotée et l'échantillon de langue cible, et une deuxième unité de production qui produit un modèle de reconnaissance d'entité nommée pour la langue cible en fonction du modèle de reconnaissance d'entité nommée pour la langue source annotée et de la similitude.
(JA) 一実施形態に係る多言語の固有表現認識システムは、注釈付きのソース言語のサンプルと、ターゲット言語のサンプルとを取得する取得部と、注釈付きのソース言語のサンプルに対して条件付き確率場の系列ラベリングを適用して注釈付きのソース言語の固有表現のそれぞれについて最適な重みを求めることで、注釈付きのソース言語の固有表現認識モデルを生成する第1生成部と、注釈付きのソース言語のサンプルとターゲット言語のサンプルとの類似度を算出する算出部と、注釈付きのソース言語の固有表現認識モデルと類似度とに基づいて、ターゲット言語の固有表現認識モデルを生成する第2生成部とを備える。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Japanese (JA)
Filing Language: Japanese (JA)
Also published as:
US20190034407