Processing

Please wait...

Settings

Settings

Goto Application

1. WO1997034291 - MICROSEGMENT-BASED SPEECH-SYNTHESIS PROCESS

Publication Number WO/1997/034291
Publication Date 18.09.1997
International Application No. PCT/DE1997/000454
International Filing Date 08.03.1997
Chapter 2 Demand Filed 26.09.1997
IPC
G10L 13/07 2013.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
06Elementary speech units used in speech synthesisers; Concatenation rules
07Concatenation rules
G10L 13/04 2013.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
02Methods for producing synthetic speech; Speech synthesisers
04Details of speech synthesis systems, e.g. synthesiser structure or memory management
CPC
G10L 13/04
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
02Methods for producing synthetic speech; Speech synthesisers
04Details of speech synthesis systems, e.g. synthesiser structure or memory management
G10L 13/07
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
06Elementary speech units used in speech synthesisers; Concatenation rules
07Concatenation rules
Applicants
  • G DATA SOFTWARE GMBH [DE]/[DE] (AllExceptUS)
  • BARRY, William [GB]/[DE] (UsOnly)
  • BENZMÜLLER, Ralf [DE]/[DE] (UsOnly)
  • LÜNING, Andreas [DE]/[DE] (UsOnly)
Inventors
  • BARRY, William
  • BENZMÜLLER, Ralf
  • LÜNING, Andreas
Agents
  • KUNZE, Klaus
Priority Data
196 10 019.414.03.1996DE
Publication Language German (de)
Filing Language German (DE)
Designated States
Title
(DE) AUF MIKROSEGMENTEN BASIERENDES SPRACHSYNTHESEVERFAHREN
(EN) MICROSEGMENT-BASED SPEECH-SYNTHESIS PROCESS
(FR) PROCEDE DE SYNTHESE VOCALE A BASE DE MICROSEGMENTS
Abstract
(DE) Die Erfindung betrifft ein digitales Sprachsyntheseverfahren, bei dem vorab Äußerungen einer Sprache aufgenommen, die aufgenommenen Äußerungen in Sprachsegmente geteilt und die Segmente bestimmten Phonemen zuordbar abgespeichert werden, wobei dann jeweils ein als Sprache auszugebender Text in eine Phonemkette überführt wird und die abgespeicherten Segmente in einer durch diese Phonemkette definierten Reihenfolge aufeinanderfolgend ausgegeben werden, wobei eine Analyse an dem als Sprache auszugebenden Text erfolgt und damit die Phonemkette ergänzende Informationen liefert, die das Zeitreihensignal der für die Sprachausgabe aneinanderzureihenden Sprachsegmente beeinflussen. Die Erfindung ist dadurch gekennzeichnet, daß Mikrosegmente als Sprachsegmente verwendet werden, die bestehen aus: Segmenten für Vokalhälften und Halbvokalhälften, wobei Vokale, die zwischen Konsonanten stehen, in zwei Mikrosegmente, eine erste Vokalhälfte beginnend kurz hinter dem Vokalanfang bis zur Mitte des Vokals und eine zweite Vokalhälfte von der Vokalmitte bis kurz vor das Vokalende, geteilt sind, Segmenten für quasi stationäre Vokalteile, die aus der Mitte eines Vokals herausgeschnitten werden, konsonantischen Segmenten, die kurz hinter der vorderen Lautgrenze beginnen und kurz vor der hinteren Lautgrenze enden, und Segmenten für Vokal-Vokal-Folgen, die aus der Mitte eines Vokal-Vokalübergangs herausgeschnitten werden.
(EN) The invention concerns a digital speech-synthesis process whereby utterances in a language are recorded, the recorded utterances are divided into speech segments which are stored so as to allow their allocation to specific phonemes; a text which is to be output as speech is converted to a phoneme chain and the stored segments are output in a sequence defined by the phoneme chain; an analysis of the text to be output as speech is carried out and thus provides information which completes the phoneme chain and modifies the timing sequence signal for the speech segments which are to be strung together for output as speech. The invention is characterised by the use of, as speech segments, microsegments consisting of: segments for vowel halves and semi-vowel halves, vowels standing between consonants being split into two microsegments, a first vowel half beginning shortly before the start of the vowel and extending as far as the vowel middle, and a second vowel half from the vowel middle to just before the vowel end; segments for quasi-stationary vowel components cut from the middle of a vowel; consonant segments beginning shortly before the front phoneme boundary and ending shortly before the rear phoneme boundary; and segments for vowel-vowel sequences cut from the middle of a vowel-vowel transition.
(FR) La présente invention concerne un procédé numérique de synthèse vocale dans lequel les paroles d'une langue sont enregistrées à l'avance et découpées en segments vocaux qui sont mémorisés pour pouvoir être attribués à certains phonèmes: chaque fois qu'un texte doit être émis comme parole, il est converti dans une chaîne de phonèmes, les segments mémorisés étant émis successivement dans un ordre défini par cette chaîne de phonèmes. Le texte à émettre comme parole est analysé et fournit ainsi les informations qui complètent la chaîne de phonèmes qui influent sur le signal de séquence temporelle des segments à aligner pour l'émission de la parole. Cette invention est caractérisée par l'utilisation de microsegments comme segments vocaux, qui sont composés de: segments pour les moitiés de voyelles et les moitiés de semi-voyelles, les voyelles situées entre des consonnes étant séparées en deux microsegments, la première moitié commençant peu après le début de la voyelle et allant jusqu'au milieu de la voyelle, et la seconde moitié débutant au milieu de la voyelle pour finir peu avant la fin de la voyelle; segments pour parties de voyelles quasiment stationnaires découpées dans le milieu d'une voyelle; segments consonantiques commençant peu après la limite vocale avant et finissant peu après la limite vocale arrière, et segments pour successions voyelle-voyelle découpées dans le milieu d'une transition voyelle-voyelle.
Related patent documents
Latest bibliographic data on file with the International Bureau