Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020195022 - VOICE DIALOGUE SYSTEM, MODEL GENERATION DEVICE, BARGE-IN SPEECH DETERMINATION MODEL, AND VOICE DIALOGUE PROGRAM

Publication Number WO/2020/195022
Publication Date 01.10.2020
International Application No. PCT/JP2020/000914
International Filing Date 14.01.2020
IPC
G10L 15/10 2006.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
10using distance or distortion measures between unknown speech and reference templates
G10L 15/22 2006.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
22Procedures used during a speech recognition process, e.g. man-machine dialog
G10L 15/28 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
28Constructional details of speech recognition systems
Applicants
  • 株式会社NTTドコモ NTT DOCOMO, INC. [JP]/[JP]
Inventors
  • 千葉 麻莉子 CHIBA Mariko
  • 浅見 太一 ASAMI Taichi
Agents
  • 長谷川 芳樹 HASEGAWA Yoshiki
  • 黒木 義樹 KUROKI Yoshiki
  • 沖山 隆 OKIYAMA Takashi
  • 深石 賢治 FUKAISHI Kenji
Priority Data
2019-05791726.03.2019JP
Publication Language Japanese (JA)
Filing Language Japanese (JA)
Designated States
Title
(EN) VOICE DIALOGUE SYSTEM, MODEL GENERATION DEVICE, BARGE-IN SPEECH DETERMINATION MODEL, AND VOICE DIALOGUE PROGRAM
(FR) SYSTÈME DE DIALOGUE VOCAL, DISPOSITIF DE GÉNÉRATION DE MODÈLE, MODÈLE DE DÉTERMINATION DE PAROLE D'INTERRUPTION ET PROGRAMME DE DIALOGUE VOCAL
(JA) 音声対話システム、モデル生成装置、バージイン発話判定モデル及び音声対話プログラム
Abstract
(EN)
In the present invention, a voice dialogue device comprises: a recognition unit that recognizes acquired user speech; a barge-in speech control unit that determines whether to adopt barge-in speech; a dialogue control unit that outputs a system response to the user on the basis of recognition results of the user speech other than the barge-in speech which the barge-in speech control unit determined to not adopt; a response generation unit that generates a system speech on the basis of the system response; and an output unit that outputs the system speech. The barge-in speech control unit determines, if an individual user speech element included in the user speech is a prescribed morpheme included in an immediately preceding system speech and is not a candidate for a user answer to the immediately preceding system speech, that said user speech element will at least not be adopted.
(FR)
Dans la présente invention, un dispositif de dialogue vocal comprend : une unité de reconnaissance qui reconnaît une parole d'utilisateur acquise ; une unité de commande de parole d'interruption qui détermine s'il convient ou non d'adopter une parole d'interruption ; une unité de commande de dialogue qui délivre en sortie une réponse de système à l'utilisateur sur la base de résultats de reconnaissance de la parole de l'utilisateur autre que la parole d'interruption que l'unité de commande de parole d'interruption a déterminé de ne pas adopter ; une unité de génération de réponse qui génère une parole de système sur la base de la réponse de système ; et une unité de sortie qui délivre en sortie la parole de système. L'unité de commande de parole d'interruption détermine, si un élément de parole d'utilisateur individuel inclus dans la parole d'utilisateur est un morphème prescrit inclus dans un discours de système immédiatement précédent et n'est pas un candidat pour une réponse d'utilisateur au discours de système immédiatement précédent, que ledit élément de parole d'utilisateur ne sera pas adopté.
(JA)
音声対話装置は、取得されたユーザ発話を認識する認識部と、バージイン発話の採否を判定するバージイン発話制御部と、バージイン発話制御部により不採用と判定されたバージイン発話以外のユーザ発話の認識結果に基づいて、ユーザに対してのシステム応答を出力する対話制御部と、システム応答に基づいてシステム発話を生成する応答生成部と、システム発話を出力する出力部とを備え、バージイン発話制御部は、ユーザ発話に含まれる各ユーザ発話要素が、直前システム発話に含まれる所定の形態素に該当し且つ直前システム発話に対するユーザによる回答候補に該当しない場合に、当該ユーザ発話要素を少なくとも不採用とする。
Latest bibliographic data on file with the International Bureau