Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020114323 - METHOD AND APPARATUS FOR CUSTOMIZED SPEECH SYNTHESIS

Publication Number WO/2020/114323
Publication Date 11.06.2020
International Application No. PCT/CN2019/121852
International Filing Date 29.11.2019
IPC
G10L 13/08 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Applicants
  • 阿里巴巴集团控股有限公司 ALIBABA GROUP HOLDING LIMITED
Inventors
  • 孙尧 SUN, Yao
Agents
  • 北京三友知识产权代理有限公司 BEIJING SANYOU INTELLECTUAL PROPERTY AGENCY LTD.
Priority Data
201811489961.806.12.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) METHOD AND APPARATUS FOR CUSTOMIZED SPEECH SYNTHESIS
(FR) PROCÉDÉ ET APPAREIL POUR SYNTHÈSE VOCALE PERSONNALISÉE
(ZH) 一种用于个性化语音合成的方法和装置
Abstract
(EN)
Disclosed are a method and apparatus for customized speech synthesis. The method comprises: receiving a TTS model generation request input by a user, wherein the TTS model generation request comprises a target field identifier (102); sending to the user a target record text corresponding to the target field identifier and receiving an audio file corresponding to the target record text and returned by the user, wherein the audio file is obtained by the user who performs recording according to the target record text (104); and according to the audio file, generating for the user a target TTS model corresponding to the target field identifier, wherein the target TTS model is used for providing a customized speech synthesis service having a pronunciation feature of the user (106).
(FR)
L'invention concerne un procédé et un appareil pour la synthèse vocale personnalisée. Le procédé comprend les étapes suivantes : réception d'une demande de génération de modèle TTS entrée par un utilisateur, la demande de génération de modèle TTS comprenant un identificateur de champ cible (102) ; envoi à l'utilisateur d'un texte d'enregistrement cible correspondant à l'identificateur de champ cible et réception d'un fichier audio correspondant au texte d'enregistrement cible et renvoyé par l'utilisateur, le fichier audio étant obtenu par l'utilisateur qui effectue un enregistrement selon le texte d'enregistrement cible (104) ; et selon le fichier audio, génération pour l'utilisateur d'un modèle TTS cible correspondant à l'identificateur de champ cible, le modèle TTS cible étant utilisé pour fournir un service de synthèse vocale personnalisé ayant une caractéristique de prononciation de l'utilisateur (106).
(ZH)
一种用于个性化语音合成的方法和装置,方法包括:接收用户输入的TTS模型生成请求,TTS模型生成请求中包括目标领域标识(102);向用户发送与目标领域标识对应的目标录音文本,并接收用户返回的与目标录音文本对应的音频文件,音频文件是用户根据目标录音文本录制得到的(104);根据音频文件,为用户生成与目标领域标识对应的目标TTS模型,所述目标TTS模型用于提供具有所述用户发音特点的个性化语音合成服务(106)。
Latest bibliographic data on file with the International Bureau