Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018067547) SPEECH SYNTHESIS
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/067547 International Application No.: PCT/US2017/054913
Publication Date: 12.04.2018 International Filing Date: 03.10.2017
IPC:
G10L 13/04 (2013.01) ,G10L 13/10 (2013.01)
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13
Speech synthesis; Text to speech systems
02
Methods for producing synthetic speech; Speech synthesisers
04
Details of speech synthesis systems, e.g. synthesiser structure or memory management
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13
Speech synthesis; Text to speech systems
08
Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
10
Prosody rules derived from text; Stress or intonation
Applicants:
NUANCE COMMUNICATIONS, INC. [US/US]; One Wayside Road Burlington, Massachusetts 01803, US
Inventors:
POLLET, Vincent; US
ZOVATO, Enrico; US
Agent:
DANNENBERG, Ross; US
Priority Data:
15/648,02212.07.2017US
62/403,77104.10.2016US
62/526,81229.06.2017US
Title (EN) SPEECH SYNTHESIS
(FR) SYNTHÈSE DE LA PAROLE
Abstract:
(EN) Aspects of the disclosure are related to synthesizing speech or other audio based on input data. Additionally, aspects of the disclosure are related to using one or more recurrent neural networks. For example, a computing device may receive text input; may determine features based on the text input; may provide the features as input to an recurrent neural network; may determine embedded data from one or more activations of a hidden layer of the recurrent neural network; may determine speech data based on a speech unit search that attempts to select, from a database, speech units based on the embedded data; and may generate speech output based on the speech data.
(FR) Des aspects de la présente invention ont trait à la synthèse de la parole ou d'un autre contenu audio basé sur des données d'entrée. De plus, des aspects de la présente invention ont trait à l'utilisation d'un ou de plusieurs réseaux neuronaux récurrents. Par exemple, un dispositif informatique peut recevoir une entrée textuelle; peut déterminer des caractéristiques basées sur l'entrée textuelle; peut fournir les caractéristiques, en tant qu'entrées, à un réseau neuronal récurrent; peut déterminer des données intégrées à partir d'une ou de plusieurs activations d'une couche cachée du réseau neuronal récurrent; peut déterminer des données de parole sur la base d'une recherche d'unité de parole qui essaie de sélectionner, dans une base de données, des unités de parole sur la base des données intégrées; et peut générer une sortie de paroles sur la base des données de parole.
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)