Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018121757) METHOD AND SYSTEM FOR SPEECH BROADCAST OF TEXT
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/121757 International Application No.: PCT/CN2017/119976
Publication Date: 05.07.2018 International Filing Date: 29.12.2017
IPC:
G10L 13/02 (2013.01) ,G10L 13/08 (2013.01)
[IPC code unknown for G10L 13/02][IPC code unknown for G10L 13/08]
Applicants:
深圳市优必选科技有限公司 UBTECH ROBOTICS CORP [CN/CN]; 中国广东省深圳市 南山区学苑大道1001号南山智园C1栋16、22楼 16th and 22nd Floor, Block C1, Nanshan I Park, No. 1001 Xueyuan Road, Nanshan District Shenzhen, Guangdong 518057, CN
Inventors:
熊友军 XIONG, Youjun; CN
万向峰 WAN, Xiangfeng; CN
陈林 CHEN, Lin; CN
Priority Data:
201611266121.631.12.2016CN
Title (EN) METHOD AND SYSTEM FOR SPEECH BROADCAST OF TEXT
(FR) PROCÉDÉ ET SYSTÈME DE DIFFUSION VOCALE DE TEXTE
(ZH) 文本语音播报方法及系统
Abstract:
(EN) Disclosed is a method for the speech broadcast of a text, comprising: acquiring text information (S101); analyzing the text information, and extracting a text feature (S102); predicting a prosody feature parameter corresponding to the text information on the basis of the text feature and a neural network prosody model (S103); and synthesizing and broadcasting a speech according to the prosody feature parameter (S104). The provided method and system for speech broadcast overcome the defect that the speech broadcast by a similar product on the market is stiff and unnatural and has only a single tone quality, thereby making the speech broadcast of a text natural and fluent, and providing more different selections for tone qualities, so that the speech is similar to language-based communication to a greater extent.
(FR) L'invention concerne un procédé de diffusion vocale d'un texte, consistant : à acquérir des informations de texte (S101) ; à analyser les informations de texte, et à extraire une caractéristique de texte (S102) ; à prédire un paramètre de caractéristique de prosodie correspondant aux informations de texte sur la base de la caractéristique de texte et d'un modèle de prosodie de réseau neuronal (S103) ; et à synthétiser et à diffuser une parole selon le paramètre de caractéristique de prosodie (S104). Le procédé et le système proposés pour la diffusion vocale résolvent le défaut selon lequel la diffusion vocale par un produit similaire sur le marché est rigide et non naturelle et n'a qu'une seule qualité de tonalité, ce qui rend la diffusion vocale d'un texte naturel et fluide, et fournit plus de sélections différentes pour des qualités de tonalité, de telle sorte que la parole est similaire à une communication basée sur la langue dans une plus grande mesure.
(ZH) 公开了文本语音播报方法,包括:采集文本信息(S101);分析文本信息,并提取出文本特征(S102);基于文本特征以及神经网络韵律模型预测文本信息对应的韵律特征参数(S103);根据韵律特征参数进行语音合成并播放(S104)。提供的语音播报方法及系统,克服了市面上类似产品播报语音生硬不自然,音色单一的不足,让文本的语音播报自然流畅,有更多不同的音色选择,更大程度上接近于人的语言沟通。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)