このアプリケーションの一部のコンテンツは現時点では利用できません。
このような状況が続く場合は、にお問い合わせくださいフィードバック & お問い合わせ
1. (WO2018021237) 音声対話装置、音声対話方法、および記録媒体
国際事務局に記録されている最新の書誌情報    第三者情報を提供

国際公開番号: WO/2018/021237 国際出願番号: PCT/JP2017/026681
国際公開日: 01.02.2018 国際出願日: 24.07.2017
IPC:
G10L 15/22 (2006.01) ,G06F 3/16 (2006.01) ,G10L 13/00 (2006.01) ,G10L 15/00 (2013.01) ,G10L 15/04 (2013.01) ,G10L 15/10 (2006.01)
G 物理学
10
楽器;音響
L
音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15
音声認識
22
音声認識処理中の手順,例.マン・マシン対話
G 物理学
06
計算;計数
F
電気的デジタルデータ処理
3
計算機で処理しうる形式にデータを変換するための入力装置;処理ユニットから出力ユニットへデータを転送するための出力装置,例.インタフェース装置
16
音声入力;音声出力
G 物理学
10
楽器;音響
L
音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
13
音声の合成;テキストを音声に変換するシステム
G 物理学
10
楽器;音響
L
音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15
音声認識
G 物理学
10
楽器;音響
L
音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15
音声認識
04
セグメンテーション;語句境界検出
G 物理学
10
楽器;音響
L
音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15
音声認識
08
音声の識別または探索
10
未知音声と標準パタンとの距離または歪みを用いるもの
出願人:
国立研究開発法人情報通信研究機構 NATIONAL INSTITUTE OF INFORMATION AND COMMUNICATIONS TECHNOLOGY [JP/JP]; 東京都小金井市貫井北町4-2-1 4-2-1, Nukui-Kitamachi, Koganei-shi, Tokyo 1848795, JP
発明者:
廣江 厚夫 HIROE, Atsuo; JP
岡本 拓磨 OKAMOTO, Takuma; JP
代理人:
谷川 英和 TANIGAWA, Hidekazu; JP
優先権情報:
2016-14898428.07.2016JP
発明の名称: (EN) SPEECH DIALOGUE DEVICE, SPEECH DIALOGUE METHOD, AND RECORDING MEDIUM
(FR) DISPOSITIF DE DIALOGUE VOCAL, PROCÉDÉ DE DIALOGUE VOCAL, ET MOYEN D'ENREGISTREMENT
(JA) 音声対話装置、音声対話方法、および記録媒体
要約:
(EN) [Problem] In the prior art, it had not been possible to appropriately support speech dialogue involving multiple languages. [Solution] A speech dialogue device comprising: a receiver that detects the starting point to the ending point of utterance of input speech spoken in two or more different languages, and acquires speech data in this interval; a language identifier acquisition unit that acquires language identifiers that identify the languages of the input speech; a speech recognition unit that generates speech recognition results in the form of text in accordance with the input speech and the language identifiers; a dialogue control unit that inputs the speech recognition result text and the language identifiers, and maintains a history of dialogue even when the language identifiers change from the most recent identifiers, while generating output sentences of different content in accordance with the language identifiers; a speech synthesis unit that generates speech waveforms in accordance with the output sentences and the language identifiers; and a speech output unit that outputs speech corresponding to the speech waveforms acquired by the speech synthesis unit, whereby speech dialogue involving multiple languages can be appropriately supported.
(FR) Le problème décrit par la présente invention est que, dans l'état de la technique, il n'était pas possible de prendre en charge de manière appropriée un dialogue vocal impliquant de multiples langues. La solution selon l'invention porte sur un dispositif de dialogue vocal comprenant : un récepteur qui détecte le point de départ jusqu'au point final de l'énoncé d'une parole d'entrée prononcée dans au moins deux langues différentes, et acquiert des données vocales dans cet intervalle ; une unité d'acquisition d'identificateur de langue qui acquiert des identificateurs de langue qui identifient les langues de la parole d'entrée ; une unité de reconnaissance vocale qui génère des résultats de reconnaissance vocale sous la forme d'un texte conformément aux paroles d'entrée et aux identificateurs de langue ; une unité de commande de dialogue qui entre le texte de résultat de reconnaissance vocale et les identificateurs de langue, et entretient un historique de dialogue même lorsque les identificateurs de langue changent par rapport aux identificateurs les plus récents, tout en générant des phrases de sortie de différents contenus conformément aux identificateurs de langue ; une unité de synthèse vocale qui génère des formes d'ondes vocales selon les phrases de sortie et les identificateurs de langue ; et une unité de sortie vocale qui émet des paroles correspondant aux formes d'onde de paroles acquises par l'unité de synthèse vocale, ce par quoi un dialogue vocal impliquant de multiples langues peut être prise en charge de manière appropriée.
(JA) 【課題】従来技術において、複数の言語による音声対話を適切に支援できなかった。 【解決手段】2以上の異なる言語により発声された入力音声に対し、その発話の始端から終端までを検出して該当区間の音声データを取得する受付部と、入力音声の言語を識別する言語識別子を取得する言語識別子取得部と、入力音声および言語識別子に応じて音声認識結果であるテキストを生成する音声認識部と、音声認識結果のテキストと言語識別子とを入力し、前回とは言語識別子が変わっても対話の履歴は維持する一方で言語識別子に応じて異なる内容の出力文を生成する対話制御部と、出力文および言語識別子に応じて音声波形を生成する音声合成部と、音声合成部が取得した音声波形に応じた音声を出力する音声出力部とを具備する音声対話装置により、複数の言語による音声対話を適切に支援できる。
front page image
指定国: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
アフリカ広域知的所有権機関(ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
ユーラシア特許庁(EAPO) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
欧州特許庁(EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
アフリカ知的所有権機関(OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
国際公開言語: 日本語 (JA)
国際出願言語: 日本語 (JA)