Processing

Please wait...

Settings

Settings

Goto Application

1. WO2022094740 - CONTROLLED TRAINING AND USE OF TEXT-TO-SPEECH MODELS AND PERSONALIZED MODEL GENERATED VOICES

Publication Number WO/2022/094740
Publication Date 12.05.2022
International Application No. PCT/CN2020/126047
International Filing Date 03.11.2020
IPC
G10L 13/02 2013.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
02Methods for producing synthetic speech; Speech synthesisers
Applicants
  • MICROSOFT TECHNOLOGY LICENSING, LLC [US]/[US]
  • ZHAO, Sheng [CN]/[CN] (US)
  • JIANG, Li [US]/[US] (US)
  • HUANG, Xuedong [US]/[US] (US)
  • QIN, Lijuan [US]/[US] (US)
  • HE, Lei [CN]/[CN] (US)
  • DING, Binggong [CN]/[CN] (US)
  • YAN, Bo [US]/[US] (US)
  • MA, Chunling [CN]/[CN] (US)
  • OBEROI, Raunak [IN]/[IN] (US)
Inventors
  • ZHAO, Sheng
  • JIANG, Li
  • HUANG, Xuedong
  • QIN, Lijuan
  • HE, Lei
  • DING, Binggong
  • YAN, Bo
  • MA, Chunling
  • OBEROI, Raunak
Agents
  • SHANGHAI PATENT & TRADEMARK LAW OFFICE, LLC
Priority Data
Publication Language English (en)
Filing Language English (EN)
Designated States
Title
(EN) CONTROLLED TRAINING AND USE OF TEXT-TO-SPEECH MODELS AND PERSONALIZED MODEL GENERATED VOICES
(FR) ENTRAÎNEMENT CONTROLÉ ET UTILISATION DE MODÈLES DE TEXTE-PAROLE ET VOIX GÉNÉRÉES PAR DES MODÈLES PERSONNALISÉES
Abstract
(EN) Systems are configured for generating text-to-speech data in a personalized voice by training a neural text-to-speech machine learning model on natural speech data collected from a particular user, validating the identity of the user from which data is collected, and authorizing requests from users to use the personalized voice in generating new speech data. The systems are further configured to train a machine learning model as a neural text-to-speech model with generated personalized speech data.
(FR) La présente invention concerne des systèmes qui sont configurés pour générer des données texte-parole dans une voix personnalisée en apprenant un modèle d'apprentissage machine texte-parole neuronal sur des données de parole naturelle collectées à partir d'un utilisateur particulier, en validant l'identité de l'utilisateur à partir duquel des données sont collectées, et en autorisant les demandes provenant des utilisateurs à utiliser la voix personnalisée dans la génération de nouvelles données de parole. Les systèmes sont en outre configurés pour entraîner un modèle d'apprentissage machine en tant que modèle texte-parole neuronal avec des données de parole personnalisée générées.
Latest bibliographic data on file with the International Bureau