WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2018048934) GÉNÉRATION D'AUDIO À L'AIDE DE RÉSEAUX NEURONAUX
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication :    WO/2018/048934    N° de la demande internationale :    PCT/US2017/050320
Date de publication : 15.03.2018 Date de dépôt international : 06.09.2017
CIB :
G06N 3/04 (2006.01)
Déposants : DEEPMIND TECHNOLOGIES LIMITED [GB/GB]; 5 New Street Square London EC4A 3TW (GB)
Inventeurs : VAN DEN OORD, Aaron Gerard Antonius; (GB).
DIELEMAN, Sander Etienne Lea; (GB).
KALCHBRENNER, Nal Emmerich; (GB).
SIMONYAN, Karen; (GB).
VINYALS, Oriol; (GB)
Mandataire : PORTNOV, Michael; (US).
TROESCH, Hans R.; (US)
Données relatives à la priorité :
62/384,115 06.09.2016 US
Titre (EN) GENERATING AUDIO USING NEURAL NETWORKS
(FR) GÉNÉRATION D'AUDIO À L'AIDE DE RÉSEAUX NEURONAUX
Abrégé : front page image
(EN)Methods, systems, and apparatus, including computer programs encoded on computer storage media, for generating an output sequence of audio data that comprises a respective audio sample at each of a plurality of time steps. One of the methods includes, for each of the time steps: providing a current sequence of audio data as input to a convolutional subnetwork, wherein the current sequence comprises the respective audio sample at each time step that precedes the time step in the output sequence, and wherein the convolutional subnetwork is configured to process the current sequence of audio data to generate an alternative representation for the time step; and providing the alternative representation for the time step as input to an output layer, wherein the output layer is configured to: process the alternative representation to generate an output that defines a score distribution over a plurality of possible audio samples for the time step.
(FR)L'invention concerne également des procédés, des systèmes et un appareil, comprenant des programmes informatiques codés sur des supports de stockage informatiques, pour générer une séquence de sortie de données audio qui comprend un échantillon audio respectif à chacune d'une pluralité d'étapes temporelles. L'un des procédés comprend, pour chacune des étapes de temps : la fourniture d'une séquence actuelle de données audio en tant qu'entrée à un sous-réseau de convolution, la séquence de courant comprenant l'échantillon audio respectif à chaque étape de temps qui précède l'étape de temps dans la séquence de sortie, et le sous-réseau de convolution étant configuré pour traiter la séquence actuelle de données audio pour générer une représentation alternative pour l'étape de temps; et fournir la représentation alternative pour l'étape de temps en tant qu'entrée à une couche de sortie, la couche de sortie étant configurée pour: traiter la représentation alternative pour générer une sortie qui définit une distribution de score sur une pluralité d'échantillons audio possibles pour l'étape de temps.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)