WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2018081163) TRANSFORMATIONS DE SÉQUENCE EN SÉQUENCE PERMETTANT LA SYNTHÈSE DE LA PAROLE PAR L'INTERMÉDIAIRE DE RÉSEAUX NEURONAUX RÉCURRENTS
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication :    WO/2018/081163    N° de la demande internationale :    PCT/US2017/058138
Date de publication : 03.05.2018 Date de dépôt international : 24.10.2017
CIB :
G10L 25/00 (2013.01)
Déposants : SEMANTIC MACHINES, INC. [US/US]; One Gatway Center 300 Washington Street, Unit 302 Newton, MA 02458 (US)
Inventeurs : HALL, David Leo Wright; (US).
KLEIN, David; (US).
ROTH, Daniel; (US).
GILLICK, Lawrence; (US).
MAAS, Andrew; (US).
WEGMANN, Steven; (US)
Mandataire : BACHMANN, Steve; Bachmann Law Group 19925 Stevens Creek Blvd, Ste 100 Cupertino, CA 95014 (US)
Données relatives à la priorité :
62/412,165 24.10.2016 US
15/792,236 24.10.2017 US
Titre (EN) SEQUENCE TO SEQUENCE TRANSFORMATIONS FOR SPEECH SYNTHESIS VIA RECURRENT NEURAL NETWORKS
(FR) TRANSFORMATIONS DE SÉQUENCE EN SÉQUENCE PERMETTANT LA SYNTHÈSE DE LA PAROLE PAR L'INTERMÉDIAIRE DE RÉSEAUX NEURONAUX RÉCURRENTS
Abrégé : front page image
(EN)A system eliminates alignment processing and performs TTS functionality using a new neural architecture. The neural architecture includes an encoder and a decoder. The encoder receives an input and encodes it into vectors. The encoder applies a sequence of transformations to the input and generates a vector representing the entire sentence. The decoder takes the encoding and outputs an audio file, which can include compressed audio frames.
(FR)L'invention concerne un système qui élimine le traitement d'alignement et effectue une fonctionnalité texte-parole (TTS) à l'aide d'une nouvelle architecture neuronale. L'architecture neuronale comprend un codeur et un décodeur. Le codeur reçoit une entrée et la code en vecteurs. Le codeur applique une séquence de transformations à l'entrée et génère un vecteur représentant la phrase entière. Le décodeur prend le codage et produit un fichier audio, qui peut comprendre des trames audio compressées.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)