Search International and National Patent Collections
Some content of this application is unavailable at the moment.
If this situation persists, please contact us atFeedback&Contact
1. (WO1985004747) REAL-TIME TEXT-TO-SPEECH CONVERSION SYSTEM
Latest bibliographic data on file with the International Bureau

Pub. No.: WO/1985/004747 International Application No.: PCT/US1984/002010
Publication Date: 24.10.1985 International Filing Date: 04.12.1984
IPC:
G10L 13/04 (2006.01) ,G10L 13/08 (2006.01)
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13
Speech synthesis; Text to speech systems
02
Methods for producing synthetic speech; Speech synthesisers
04
Details of speech synthesis systems, e.g. synthesiser structure or memory management
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13
Speech synthesis; Text to speech systems
08
Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Applicants:
FIRST BYTE [US/US]; 2845 Temple Avenue Long Beach, CA 90806, US
Inventors:
JACKS, Richard, P.; US
SPRAGUE, Richard, P.; US
Agent:
WEISSENBERGER, Harry, G.; Weissenberger and Peterson 610 Newport Center Drive, Ste. 375 Newport Beach, CA 92660-7085, US
Priority Data:
598,89210.04.1984US
Title (EN) REAL-TIME TEXT-TO-SPEECH CONVERSION SYSTEM
(FR) SYSTEME DE CONVERSION TEXTE-PAROLE EN TEMPS REEL
Abstract:
(EN) A high-quality, real-time text-to-speech synthesizer system (Fig. 1) handles an unlimited vocabulary with a minimum of hardware by using a microcomputer-software-compatible time domain methodology which requires a minimum of memory and computational power. The system first compares text words to an exception dictionary (Fig. 2). If the word is not found therein, the system applies standard pronunciation rules to the text word. In either instance, the text word is converted to a phoneme sequence. By the use of look-up tables addressed by pointers contained in a phoneme-and-transition matrix (Fig. 3), the synthesizer translates the sequence of phonemes and transitions therebetween into sequences of small speech segments capable of being expressed in terms of repetitions of variable-length portions of short digitally stored waveforms. In general, unvoiced transitions are produced by a sequence of segments which can be concatenated in forward or reverse order to generate different transitions out of the same segments; while voiced transitions are produced by interpolating adjacent phonemes for additioanl savings. Pitch can be varied for naturalness of sound, and/or for intonation changes derived from key words and/or punctuation in the text, by truncating or extending the waveforms of individual voice periods corresponding to voiced segments.
(FR) Un système synthétiseur texte-parole en temps réel de grande qualité (Fig. 1) manipule un vocabulaire illimité avec un minimum d'équipement en utilisant une méthodologie de domaine temporel compatible avec le logiciel du micro-ordinateur qui nécessite un minimum de mémoire de puissance de calcul. Le système compare tout d'abord les mots du texte à un dictionnaire d'exceptions (Fig. 2). Si le mot n'y est pas trouvé, le système applique les règles de prononciation standard au mot du texte. Dans les deux cas, le mot du texte est converti en une séquence de phonèmes. Grâce à l'utilisation de tables de consultation adressées par des pointeurs contenus dans une matrice de phonèmes et de transitions (Fig. 3), le synthétiseur traduit la séquence de phonèmes et de transitions en des séquences de courts segments de parole pouvant être exprimés en termes de répétition de parties de longueurs variables, de courtes formes d'ondes à stockage numérique. En général, des transitions non voisées, sont produites par une séquence de segments pouvant être enchaînés dans un ordre avant ou arrière afin de produire différentes transitions à partir des mêmes segments; simultanément, des transitions voisées sont produites par interpolation de phonèmes adjacents pour des économies supplémentaires de mémoire. La hauteur du son peut être modifiée en vue du caractère naturel du son, et/ou des changements d'intonation dérivés des mots clés et/ou de la ponctuation du texte, en tronquant ou en allongeant les formes d'ondes de périodes vocales individuelles correspondant aux segments voisés.
Designated States: JP
European Patent Office (AT, BE, CH, DE, FR, GB, LU, NL, SE)
Publication Language: English (EN)
Filing Language: English (EN)
Also published as:
EP0181339