WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2018067547) SPEECH SYNTHESIS
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.:    WO/2018/067547    International Application No.:    PCT/US2017/054913
Publication Date: 12.04.2018 International Filing Date: 03.10.2017
IPC:
G10L 13/04 (2013.01), G10L 13/10 (2013.01)
Applicants: NUANCE COMMUNICATIONS, INC. [US/US]; One Wayside Road Burlington, Massachusetts 01803 (US)
Inventors: POLLET, Vincent; (US).
ZOVATO, Enrico; (US)
Agent: DANNENBERG, Ross; (US)
Priority Data:
62/403,771 04.10.2016 US
62/526,812 29.06.2017 US
15/648,022 12.07.2017 US
Title (EN) SPEECH SYNTHESIS
(FR) SYNTHÈSE DE LA PAROLE
Abstract: front page image
(EN)Aspects of the disclosure are related to synthesizing speech or other audio based on input data. Additionally, aspects of the disclosure are related to using one or more recurrent neural networks. For example, a computing device may receive text input; may determine features based on the text input; may provide the features as input to an recurrent neural network; may determine embedded data from one or more activations of a hidden layer of the recurrent neural network; may determine speech data based on a speech unit search that attempts to select, from a database, speech units based on the embedded data; and may generate speech output based on the speech data.
(FR)Des aspects de la présente invention ont trait à la synthèse de la parole ou d'un autre contenu audio basé sur des données d'entrée. De plus, des aspects de la présente invention ont trait à l'utilisation d'un ou de plusieurs réseaux neuronaux récurrents. Par exemple, un dispositif informatique peut recevoir une entrée textuelle; peut déterminer des caractéristiques basées sur l'entrée textuelle; peut fournir les caractéristiques, en tant qu'entrées, à un réseau neuronal récurrent; peut déterminer des données intégrées à partir d'une ou de plusieurs activations d'une couche cachée du réseau neuronal récurrent; peut déterminer des données de parole sur la base d'une recherche d'unité de parole qui essaie de sélectionner, dans une base de données, des unités de parole sur la base des données intégrées; et peut générer une sortie de paroles sur la base des données de parole.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)