Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020228175 - POLYPHONE PREDICTION METHOD, DEVICE, AND APPARATUS, AND COMPUTER-READABLE STORAGE MEDIUM

Publication Number WO/2020/228175
Publication Date 19.11.2020
International Application No. PCT/CN2019/102446
International Filing Date 26.08.2019
IPC
G10L 13/027 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
02Methods for producing synthetic speech; Speech synthesisers
027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
CPC
G10L 13/027
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
02Methods for producing synthetic speech; Speech synthesisers
027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
G10L 13/08
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
Applicants
  • 平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN]/[CN]
Inventors
  • 陈闽川 CHEN, Minchuan
  • 马骏 MA, Jun
  • 王少军 WANG, Shaojun
Agents
  • 北京市京大律师事务所 BEIJING JINGDA LAW FIRM
Priority Data
201910407702.416.05.2019CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) POLYPHONE PREDICTION METHOD, DEVICE, AND APPARATUS, AND COMPUTER-READABLE STORAGE MEDIUM
(FR) PROCÉDÉ, DISPOSITIF ET APPAREIL DE PRÉDICTION POLYPHONE, ET SUPPORT D'INFORMATIONS LISIBLE PAR ORDINATEUR
(ZH) 多音字预测方法、装置、设备及计算机可读存储介质
Abstract
(EN)
The present application relates to the technical field of artificial intelligence, and discloses a polyphone prediction method, device, and apparatus, and a computer-readable storage medium. The polyphone prediction method comprises: acquiring training text comprising a polyphone, and an original pronunciation of the polyphone; training, by means of the training text and the original pronunciation of the polyphone, a pre-configured polyphone prediction model on the basis of an iterative training method so as to acquire a target polyphone prediction model; acquiring text to be converted, and detecting whether a polyphone is present in the text; if a polyphone is present in the text, acquiring feature information of the text; and inputting the feature information into the target polyphone prediction model, and outputting a target pronunciation of the polyphone in the text. In the present application, a pronunciation of a polyphone in text to be converted is predicted according to feature information of the text and by means of a target polyphone prediction model, thereby improving the accuracy of predicting a polyphone.
(FR)
La présente invention appartient au domaine technique de l'intelligence artificielle, et concerne un procédé, un dispositif et un appareil de prédiction polyphone, et un support d'informations lisible par ordinateur. Le procédé de prédiction polyphone consiste à : acquérir un texte de formation comprenant un polyphone, et une prononciation d'origine du polyphone ; former, au moyen du texte de formation et de la prononciation d'origine du polyphone, un modèle de prédiction de polyphone préconfiguré sur la base d'un procédé de formation itérative de façon à acquérir un modèle de prédiction de polyphone cible ; acquérir un texte à convertir, et détecter si un polyphone est présent dans le texte ; si un polyphone est présent dans le texte, acquérir des informations de caractéristique du texte ; et entrer les informations de caractéristique dans le modèle de prédiction de polyphone cible, et délivrer en sortie une prononciation cible du polyphone dans le texte. Dans la présente invention, une prononciation d'un polyphone dans un texte à convertir est prédite en fonction d'informations de caractéristiques du texte et au moyen d'un modèle de prédiction de polyphone cible, ce qui permet d'améliorer la précision de prédiction d'un polyphone.
(ZH)
本申请涉及人工智能技术领域,公开了一种多音字预测方法、装置、设备及计算机可读存储介质,多音字预测方法包括:获取包含多音字的训练文本以及所述多音字的原始发音;通过所述训练文本以及所述多音字的原始发音,基于迭代训练的方式对预置多音字预测模型进行训练,得到目标多音字预测模型;获取待转换文本,并检测所述待转换文本中是否存在多音字;若所述待转换文本中存在多音字,则获取所述待转换文本的特征信息;将所述特征信息输入目标多音字预测模型,输出所述多音字在所述待转换文本中的目标发音。通过本申请,根据待转换文本的特征信息,通过目标多音字预测模型预测多音字在待转换文本中的读音,提高了对多音字进行预测的准确度。
Latest bibliographic data on file with the International Bureau