このアプリケーションの一部のコンテンツは現時点では利用できません。
このような状況が続く場合は、にお問い合わせくださいフィードバック & お問い合わせ
1. (WO2018100700) データ変換装置とデータ変換方法
国際事務局に記録されている最新の書誌情報    第三者情報を提供

国際公開番号: WO/2018/100700 国際出願番号: PCT/JP2016/085641
国際公開日: 07.06.2018 国際出願日: 30.11.2016
IPC:
G06F 17/27 (2006.01)
G 物理学
06
計算;計数
F
電気的デジタルデータ処理
17
特定の機能に特に適合したデジタル計算またはデータ処理の装置または方法
20
自然言語データの取扱い
27
自動言語解析,例.構文解析,綴字訂正
出願人:
株式会社日立製作所 HITACHI, LTD. [JP/JP]; 東京都千代田区丸の内一丁目6番6号 6-6, Marunouchi 1-chome, Chiyoda-ku, Tokyo 1008280, JP
発明者:
工藤 文也 KUDO, Fumiya; JP
林 秀樹 HAYASHI, Hideki; JP
北川 健二 KITAGAWA, Kenji; JP
溝手 裕二 MIZOTE, Yuuji; JP
代理人:
特許業務法人サンネクスト国際特許事務所 SUNNEXT INTERNATIONAL PATENT OFFICE; 東京都品川区東品川二丁目3番12号 シーフォ-トスクエア センタ-ビルディング16階 Seafort Square Center Building, 16F, 2-3-12, Higashishinagawa, Shinagawa-ku, Tokyo 1400002, JP
優先権情報:
発明の名称: (EN) DATA CONVERSION DEVICE AND DATA CONVERSION METHOD
(FR) DISPOSITIF DE CONVERSION DE DONNÉES ET PROCÉDÉ DE CONVERSION DE DONNÉES
(JA) データ変換装置とデータ変換方法
要約:
(EN) The present invention comprises a memory that stores a program and a processor that processes data on the basis of the program stored in memory. The processor: receives, as input data to be processed, input of natural language text data and/or character-string format data items stored in a structured table; tabulates, as a plurality of characters to be tabulated, a combination of a first character to be tabulated among elements constituting the input data which was input, and one or more characters consecutive to the first character; calculates an appearance frequency or information amount of each character to be tabulated which was tabulated on the basis of the tabulation results; calculates an appearance frequency change point or information amount change point of each character to be tabulated on the basis of the calculated appearance frequency or information amount; and separates the plurality of characters to be tabulated on the basis of the calculated appearance frequency change point or information amount change point.
(FR) La présente invention comprend une mémoire qui stocke un programme, et un processeur qui traite des données sur la base du programme stocké en mémoire. Le processeur : reçoit, en tant que données d'entrée à traiter, une entrée de données de texte en langage naturel et/ou des éléments de données de format de chaîne de caractères stockés dans une table structurée ; tabule, sous la forme d'une pluralité de caractères à tabuler, une combinaison d'un premier caractère à tabuler parmi des éléments constituant les données d'entrée qui ont été entrées, et d'un ou de plusieurs caractères consécutifs au premier caractère ; calcule une fréquence d'apparition ou une quantité d'informations de chaque caractère à tabuler qui a été tabulé sur la base des résultats de tabulation ; calcule un moment de changement de fréquence d'apparition ou un moment de changement de quantité d'informations de chaque caractère à tabuler sur la base de la fréquence d'apparition calculée ou de la quantité d'informations calculée ; et sépare la pluralité de caractères à tabuler sur la base du moment de changement de fréquence d'apparition calculé ou du moment de changement de quantité d'informations calculé.
(JA) プログラムを記憶するメモリと、メモリに記憶されたプログラムを基にデータを処理するプロセッサを備え、プロセッサは、自然言語の文章のデータと構造化されたテーブルに格納される文字列形式のデータのうち少なくとも一方のデータを処理対象となる入力データとして入力し、入力した入力データを構成する要素のうち集計対象となる第一の文字と当該第一の文字に連なる1又は2以上の文字の組合せを複数の集計対象文字として集計し、当該集計結果を基に集計された各集計対象文字の出現頻度又は情報量を算出し、算出された出現頻度又は情報量を基に各集計対象文字の出現頻度の変化点又は情報量の変化点を算出し、算出された出現頻度の変化点又は情報量の変化点を基に複数の集計対象文字を分離する。
front page image
指定国: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
アフリカ広域知的所有権機関(ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
ユーラシア特許庁(EAPO) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
欧州特許庁(EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
アフリカ知的所有権機関(OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
国際公開言語: 日本語 (JA)
国際出願言語: 日本語 (JA)