WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2014002775) SYSTÈME D'EXTRACTION DE SYNONYMES, PROCÉDÉ ET SUPPORT D'ENREGISTREMENT
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2014/002775    N° de la demande internationale :    PCT/JP2013/066284
Date de publication : 03.01.2014 Date de dépôt international : 06.06.2013
CIB :
G06F 17/30 (2006.01)
Déposants : NEC CORPORATION [JP/JP]; 7-1, Shiba 5-chome, Minato-ku, Tokyo 1088001 (JP).
NATIONAL UNIVERSITY CORPORATION NAGOYA UNIVERSITY [JP/JP]; 1, Furo-cho, Chikusa-ku, Nagoya-shi, Aichi 4648601 (JP)
Inventeurs : GOTOH, Tomohisa; (JP).
HIRAO, Eiji; (JP).
FURUHASHI, Takeshi; (JP).
YOSHIKAWA, Tomohiro; (JP)
Mandataire : IKEDA, Noriyasu; Hibiya Daibiru Bldg., 2-2, Uchisaiwaicho 1-chome, Chiyoda-ku, Tokyo 1000011 (JP)
Données relatives à la priorité :
2012-141876 25.06.2012 JP
Titre (EN) SYNONYM EXTRACTION SYSTEM, METHOD AND RECORDING MEDIUM
(FR) SYSTÈME D'EXTRACTION DE SYNONYMES, PROCÉDÉ ET SUPPORT D'ENREGISTREMENT
(JA) 同義語抽出システム、方法および記録媒体
Abrégé : front page image
(EN)In order to resolve ambiguities in documents with synonyms established only in a document group regarding a specific subject, such as proposals or specifications regarding information system architecture, this synonym extraction system is provided with at least: a document input unit that accepts the input of a document to be analyzed; a word analysis unit that applies morphological analysis and syntax analysis to each sentence and compound word in the document, and extracts the part of speech and dependency relationship of each word; a co-occurrence information extraction unit that extracts co-occurring word vectors according to the co-occurrence of words; a disturbance value calculation unit that calculates disturbance values to be added to the co-occurring word vectors from at least the number or frequency of occurrences of word pairs, the document size, and the number of variations of words in the document; a synonym candidate estimation unit that estimates word pair candidates having synonymous relationships as synonyms on the basis of correction cosine similarities in which the disturbance values are used; and a synonym candidate output unit that presents the estimated synonymous candidate words.
(FR)Afin d'éliminer les ambiguïtés dans les documents comprenant des synonymes établis seulement dans un groupe de documents qui concerne un sujet spécifique, par exemple des propositions ou des spécifications relatives à l'architecture d'un système d'information, le système d'extraction de synonymes ci-décrit est doté d'au moins : une unité d'entrée de document qui accepte l'entrée d'un document à analyser ; une unité d'analyse de mots qui applique une analyse morphologique et une analyse syntaxique sur chaque phrase et mot composé dans le document, et qui extrait la partie du discours et la relation de dépendance de chaque mot ; une unité d'extraction d'informations de cooccurrence qui extrait des vecteurs de mots cooccurrents en fonction de la cooccurrence des mots ; une unité de calcul de valeurs de perturbation qui calcule des valeurs de perturbation à ajouter aux vecteurs de mots cooccurrents en se basant au moins sur le nombre ou la fréquence des occurrences de paires de mots, sur la taille du document et sur le nombre de variations de mots dans le document ; une unité d'estimation de candidats synonymes qui estime que les candidates paires de mots ayant des relations de synonymie sont des synonymes, en se basant sur les similitudes de cosinus de correction où les valeurs de perturbation sont utilisées ; et une unité d'émission de candidats synonymes qui présente les mots candidats synonymes estimés.
(JA)情報システム構築に関する提案書や仕様書等というような、特定の案件に関する文書群でのみ成り立つ同義語のある文書の曖昧さを改善するために、同義語抽出システムは、分析対象である文書の入力を受け付ける文書入力部と、文書中の各文および複合語に形態素解析および構文解析を適用し、各単語の品詞や係り受け関係を抽出する単語分析部と、各単語の共起語による共起語ベクトルを抽出する共起情報抽出部と、共起語ベクトルに追加すべき攪乱値を、単語ペアの出現数あるいは出現頻度、文書量、文書中の単語のバリエーション数の少なくとも一つから算出する攪乱値算出部と、攪乱値を用いた補正コサイン類似度に基づき、同義関係を持つ単語ペア候補を同義語として推定する同義候補推定部と、推定した同義候補語を提示する同義候補出力部と、を少なくとも具備する。
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : japonais (JA)
Langue de dépôt : japonais (JA)