Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2018043598) DISPOSITIF D'AIDE À L'ANALYSE CONTEXTUELLE ET PROGRAMME INFORMATIQUE ASSOCIÉ
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2018/043598 N° de la demande internationale : PCT/JP2017/031250
Date de publication : 08.03.2018 Date de dépôt international : 30.08.2017
CIB :
G06F 17/27 (2006.01) ,G06F 17/30 (2006.01)
G PHYSIQUE
06
CALCUL; COMPTAGE
F
TRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17
Equipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
20
Manipulation de données en langage naturel
27
Analyse automatique, p.ex. analyse grammaticale, correction orthographique
G PHYSIQUE
06
CALCUL; COMPTAGE
F
TRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17
Equipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30
Recherche documentaire; Structures de bases de données à cet effet
Déposants :
国立研究開発法人情報通信研究機構 NATIONAL INSTITUTE OF INFORMATION AND COMMUNICATIONS TECHNOLOGY [JP/JP]; 東京都小金井市貫井北町4-2-1 4-2-1, Nukui-Kitamachi, Koganei-shi, Tokyo 1848795, JP
Inventeurs :
飯田 龍 IIDA, Ryu; JP
鳥澤 健太郎 TORISAWA, Kentaro; JP
クルンカライ カナサイ KRUENGKRAI, Canasai; JP
呉 鍾勲 OH, Jonghoon; JP
クロエツェー ジュリアン KLOETZER, Julien; JP
Mandataire :
清水 敏 SHIMIZU, Satoshi; JP
Données relatives à la priorité :
2016-17301705.09.2016JP
Titre (EN) CONTEXT ANALYSIS DEVICE AND COMPUTER PROGRAM THEREFOR
(FR) DISPOSITIF D'AIDE À L'ANALYSE CONTEXTUELLE ET PROGRAMME INFORMATIQUE ASSOCIÉ
(JA) 文脈解析装置及びそのためのコンピュータプログラム
Abrégé :
(EN) [Problem] To provide a context analysis device that is able to utilize contextual features comprehensively and efficiently to perform context analysis with high precision. [Solution] A context analysis device 160 that includes: an analysis control unit 230 that detects a predicate from which a subject or the like has been omitted, and a supplement candidate therefor; and an anaphor/omission analysis unit 216 that determines a word that should be supplemented. The anaphor/omission analysis unit 216 includes: word vector generation units 206, 208, 210, and 212, which, for supplement candidates, generate multiple types of word vectors from a text 204; a learned weighting neural network 214 (or LSTM) which, for each supplement candidate, inputs a word vector and calculates a score indicating a probability that the word vector is the omitted word; and a list storage unit 234 and a supplement processing unit 236, which determine the supplement candidate having the best score. The word vectors at least include multiple word vectors each of which is extracted using character strings in the entire text other than the analysis subject and the candidates. Other words, such as deictic words, can be processed in the same manner.
(FR) L'objectif de l'invention est de fournir un dispositif d'analyse contextuelle capable d'utiliser des caractéristiques contextuelles de manière complète et efficace afin d'effectuer une analyse contextuelle très précise. À cet effet, l'invention concerne un dispositif d'analyse contextuelle (160) comprenant : une unité de commande d'analyse (230) qui détecte un prédicat dont un sujet ou élément similaire a été omis, ainsi qu’un candidat supplémentaire associé ; et une unité d'analyse d'anaphores/omissions (216) qui détermine un mot qui doit être complété. L'unité d'analyse d'anaphores/omissions (216) comprend : des unités de génération de vecteurs de mots (206, 208, 210 et 212) qui, pour compléter des candidats supplémentaires, génèrent plusieurs types de vecteurs de mots à partir d'un texte (204) ; un réseau neuronal de pondération ou LSTM appris (214) qui, pour chaque candidat supplémentaire, entre un vecteur de mot et calcule un score indiquant une probabilité que le vecteur de mot soit le mot omis ; et une unité de stockage de liste (234) et une unité de traitement de candidat supplémentaire (236) qui déterminent le candidat supplémentaire ayant le meilleur score. Les vecteurs de mots comprennent au moins plusieurs vecteurs de mots, chacun d’eux étant extrait à l'aide de chaînes de caractères dans le texte complet autres que le sujet d'analyse et les candidats. D'autres mots, tels que les mots déictiques, peuvent être traités de la même manière.
(JA) 【課題】文脈的特徴を包括的かつ効率的に利用して文脈解析を高精度で行える文脈解析装置を提供する。 【解決手段】文脈解析装置160は、主語等が省略された述語と、その補完候補を検出する解析制御部230と、補完すべき語を決定する照応・省略解析部216とを含む。照応・省略解析部216は、補完候補について、文204から複数種類の単語ベクトルを生成する単語ベクトル生成部206、208、210及び212と、各補完候補について、単語ベクトルを入力として省略された語である確率を示すスコアを出力するよう学習済の畳み込みニューラルネットワーク214(又はLSTМ)と、スコアが最も良い補完候補を決定するリスト記憶部234及び補完処理部236とを含む。単語ベクトルは、各々が、少なくとも、解析対象と候補以外の文全体の文字列を用いて抽出される複数個の単語ベクトルを含む。指示語等、他の語についても同様に処理できる。
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : japonais (JA)
Langue de dépôt : japonais (JA)