Processing

Please wait...

Settings

Settings

Goto Application

1. WO2006095925 - SPEECH SYNTHESIS DEVICE, SPEECH SYNTHESIS METHOD, AND PROGRAM

Publication Number WO/2006/095925
Publication Date 14.09.2006
International Application No. PCT/JP2006/305305
International Filing Date 10.03.2006
IPC
G10L 13/06 2006.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
06Elementary speech units used in speech synthesisers; Concatenation rules
G10L 13/08 2006.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
CPC
G10L 13/06
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
06Elementary speech units used in speech synthesisers; Concatenation rules
G10L 13/08
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Applicants
  • 株式会社 ケンウッド KABUSHIKI KAISHA KENWOOD [JP]/[JP] (AllExceptUS)
  • 佐藤 寧 SATO, Yasushi [JP]/[JP] (UsOnly)
Inventors
  • 佐藤 寧 SATO, Yasushi
Agents
  • 岡部 正夫 OKABE, Masao
Priority Data
2005-06978711.03.2005JP
Publication Language Japanese (JA)
Filing Language Japanese (JA)
Designated States
Title
(EN) SPEECH SYNTHESIS DEVICE, SPEECH SYNTHESIS METHOD, AND PROGRAM
(FR) DISPOSITIF DE SYNTHESE VOCALE, PROCEDE DE SYNTHESE VOCALE ET PROGRAMME
(JA) 音声合成装置、音声合成方法及びプログラム
Abstract
(EN)
A phrase editing section (5) retrieves phrase data on a phrase the read of which matches that of a phrase in a fixed message from a phrase database (7) and converts the phrase so as to match the speed specified by utterance speed data. The phrase editing section (5) predicts the prosody of a fixed message and selects an item of the retrieved phrase data most matching each phrase of the fixed message one by one according to the prosody prediction results. However, if the proportion of the phrase corresponding to the selected item of the phrase data does not reach a predetermined value, the selection is cancelled. Concerning the phrase for which selection is not made, waveform data representing the waveform of each unit speech is supplied to a sound processing section (41). The selected phrase data and the supplied waveform data are interconnected thereby to create data representing a synthesized speech. Thus, a speech synthesis device for quickly producing a synthesized speech without any uncomfortable feeling with a simple structure is provided.
(FR)
Une section d’édition de phrases (5) récupère les données de la phrase d’une phrase dont la lecture correspond à celle d’une phrase provenant d’un message défini depuis une base de données de phrases (7) et convertit la phrase afin de correspondre à la vitesse spécifiée par les données de vitesse de l’énoncé. La section d’édition de phrases (5) prévoit la prosodie d’un message prédéfini et sélectionne un élément des données de la phrase récupérée correspondant au mieux à chaque phrase du message prédéfini une par une selon les résultats de prédiction de prosodie. Néanmoins, si la proportion de phrase correspondant à l’élément sélectionné d’atteint pas une valeur prédéterminée, la sélection est annulée. Pour les phrases pour lesquelles aucune sélection n’a été effectuée, des données de formes d’onde représentant la forme d’onde de chaque unité de discours sont fournies à une section de traitement sonore (41). Les données de phrase sélectionnées et les données de formes d’onde fournies sont interconnectées afin de créer des données représentant des paroles synthétisées. On dispose ainsi d’un dispositif de synthèse vocale pour produire rapidement des paroles synthétisées sans aucune sentiement d’inconfort à l’aide d’une structure simple.
(JA)
音片編集部5は、定型メッセージ内の音片と読みが合致する音片の音片データを音片データベース7から索出させ、発声スピードデータが示すスピードに合致するよう、この音片データを変換させる。一方で音片編集部5は定型メッセージの韻律予測を行い、索出された音片データのうちから定型メッセージ内の各音片に最もよく合致するものを1個ずつ、韻律予測結果に基づいて選択する。ただし、選択した音片データに相当する音片が定型メッセージ内で占める割合が所定値に達していない場合は選択を取り消す。選択できなかった音片については音響処理部41に単位音声毎の波形を表す波形データを供給させる。そして、選択した音片データや、音響処理部41に供給させた波形データを互いに結合して、合成音声を表すデータを生成する。簡単な構成で高速に違和感のない合成音声を得るための音声合成装置等を提供することである。
Also published as
Latest bibliographic data on file with the International Bureau