Processing

Please wait...

Settings

Settings

Goto Application

1. WO2011030424 - VOICE SYNTHESIZING APPARATUS AND PROGRAM

Publication Number WO/2011/030424
Publication Date 17.03.2011
International Application No. PCT/JP2009/065838
International Filing Date 10.09.2009
IPC
G10L 13/06 2006.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
06Elementary speech units used in speech synthesisers; Concatenation rules
G10L 13/08 2006.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
CPC
G10L 13/08
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Applicants
  • 株式会社東芝 Kabushiki Kaisha Toshiba [JP]/[JP] (AllExceptUS)
  • 田村 正統 TAMURA, Masatsune [JP]/[JP] (UsOnly)
  • 籠嶋 岳彦 KAGOSHIMA, Takehiko [JP]/[JP] (UsOnly)
Inventors
  • 田村 正統 TAMURA, Masatsune
  • 籠嶋 岳彦 KAGOSHIMA, Takehiko
Agents
  • 酒井 宏明 SAKAI, Hiroaki
Priority Data
Publication Language Japanese (JA)
Filing Language Japanese (JA)
Designated States
Title
(EN) VOICE SYNTHESIZING APPARATUS AND PROGRAM
(FR) APPAREIL ET PROGRAMME DE SYNTHÈSE VOCALE
(JA) 音声合成装置およびプログラム
Abstract
(EN)
A voice synthesizing apparatus comprises a dividing unit that divides the phonological sequence of an input text data into a plurality of segments; a phonetic fragment extracting unit that extracts a plurality of phonetic fragments that are associated with a phonological sequence, which is the same as the phonological sequence of the segments, in a storing unit; an optimum fragment selecting unit that selects, from among the plurality of phonetic fragments, optimum fragments each exhibiting the smallest cost; a number assigning unit that assigns a first number if a second adjacent fragment, which is adjacent to a target fragment, i.e., one of the optimum fragments selected for a target segment to be processed, is coincident with a first adjacent fragment associated with the target fragment in the storing unit and that assigns a second number if the second adjacent fragment is not coincident with the first adjacent fragment; a phonetic fragment selecting unit that selects ones of the plurality of phonetic fragments if the number is plural and that selects the optimum fragments if the number is one; a phonetic fragment merging unit that, if a plurality of phonetic fragments are selected, merges the plurality of phonetic fragments to obtain merged fragments; and a connecting unit that connects the merged fragments or the optimum fragments to generate a phonetic waveform.
(FR)
L'invention porte sur un appareil de synthèse vocale qui comprend une unité de division qui divise la séquence phonologique de données de texte d'entrée en une pluralité de segments ; une unité d'extraction de fragments phonétiques qui extrait une pluralité de fragments phonétiques qui sont associés à une séquence phonologique, qui est la même que la séquence phonologique des segments, contenus dans une unité de stockage ; une unité de sélection de fragments optimaux qui sélectionne, parmi la pluralité de fragments phonétiques, des fragments optimaux présentant chacun le plus bas coût ; une unité d'attribution de nombre qui attribue un premier nombre si un second fragment adjacent, qui est adjacent à un fragment cible, à savoir l'un des fragments optimaux sélectionnés pour un segment cible devant être traité, coïncide avec un premier segment adjacent associé au fragment cible dans l'unité de stockage, et qui attribue un second nombre si le second fragment adjacent ne coïncide pas avec le premier fragment adjacent ; une unité de sélection de fragments phonétiques qui sélectionne certains de la pluralité de fragments phonétiques si le nombre est pluriel et qui sélectionne les fragments optimaux si le nombre est un ; une unité de fusion de fragments phonétiques qui, si une pluralité de fragments phonétiques est sélectionnée, fusionne la pluralité de fragments phonétiques pour obtenir des fragments fusionnés ; et une unité de raccordement qui raccorde les fragments fusionnés ou les fragments optimaux afin de générer une forme d'onde phonétique.
(JA)
 入力されたテキストデータの音韻系列を複数のセグメントに分割する分割部と、記憶部において、セグメントの音韻系列と同一の音韻系列に対応付けられている複数の音声素片を抽出する音声素片抽出部と、複数の音声素片の中から、コストが最小となる最適素片を選択する最適素片選択部と、最適素片のうち処理対象となる対象セグメントに対して選択された最適素片である対象素片に隣接する第2隣接素片と、記憶部において対象素片に対応付けられている第1隣接素片とが一致する場合に第1個数、一致しない場合に第2個数を割り当てる個数割当部と、個数が複数である場合に、複数の音声素片から音声素片を選択し、個数が1である場合に前記最適素片を選択する音声素片選択部と、複数の音声素片が選択された場合に、複数の音声素片を融合し融合素片を得る音声素片融合部と、融合素片または最適素片を接続し、音声波形を生成する接続部とを備えた。
Also published as
Latest bibliographic data on file with the International Bureau