Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Goto Application

1. WO2020062217 - GÉNÉRATION DE FORME D'ONDE DE PAROLE

Numéro de publication WO/2020/062217
Date de publication 02.04.2020
N° de la demande internationale PCT/CN2018/109044
Date du dépôt international 30.09.2018
CIB
G10L 13/00 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
13Synthèse de la parole; Systèmes de synthèse de la parole à partir de texte
CPC
G10L 13/02
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
02Methods for producing synthetic speech; Speech synthesisers
Déposants
  • MICROSOFT TECHNOLOGY LICENSING, LLC [US]/[US]
  • CUI, Yang [CN]/[CN] (BZ)
  • WANG, Xi [CN]/[CN] (BZ)
  • HE, Lei [CN]/[CN] (BZ)
  • SOONG, Kao-Ping [CN]/[CN] (BZ)
Inventeurs
  • CUI, Yang
  • WANG, Xi
  • HE, Lei
  • SOONG, Kao-Ping
Mandataires
  • NTD PATENT & TRADEMARK AGENCY LTD.
Données relatives à la priorité
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) SPEECH WAVEFORM GENERATION
(FR) GÉNÉRATION DE FORME D'ONDE DE PAROLE
Abrégé
(EN)
A method and apparatus for generating a speech waveform. Fundamental frequency information, glottal features and vocal tract features associated with an input may be received, wherein the glottal features include a phase feature, a shape feature, and an energy feature (1310). A glottal waveform is generated based on the fundamental frequency information and the glottal features through a first neural network model (1320). A speech waveform is generated based on the glottal waveform and the vocal tract features through a second neural network model (1330).
(FR)
La présente invention concerne un appareil et un procédé de génération de forme d'onde de parole. Des informations de fréquence fondamentale, des caractéristiques glottales et des caractéristiques de conduit vocal associées à une entrée peuvent être reçues, les caractéristiques glottales comprenant une caractéristique de phase, une caractéristique de forme et une caractéristique d'énergie (1310). Une forme d'onde glottale est générée sur la base des informations de fréquence fondamentale et des caractéristiques glottales par l'intermédiaire d'un premier modèle de réseau neuronal (1320). Une forme d'onde vocale est générée sur la base de la forme d'onde glottale et des caractéristiques de conduite vocale par l'intermédiaire d'un second modèle de réseau neuronal (1330).
Dernières données bibliographiques dont dispose le Bureau international