WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2018048934) GENERATING AUDIO USING NEURAL NETWORKS
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/048934 International Application No.: PCT/US2017/050320
Publication Date: 15.03.2018 International Filing Date: 06.09.2017
Chapter 2 Demand Filed: 05.07.2018
IPC:
G06N 3/04 (2006.01)
Applicants: DEEPMIND TECHNOLOGIES LIMITED[GB/GB]; 5 New Street Square London EC4A 3TW, GB
Inventors: VAN DEN OORD, Aaron Gerard Antonius; GB
DIELEMAN, Sander Etienne Lea; GB
KALCHBRENNER, Nal Emmerich; GB
SIMONYAN, Karen; GB
VINYALS, Oriol; GB
Agent: PORTNOV, Michael; US
TROESCH, Hans R.; US
MARKS & CLERK LLP; 1 New York Street Manchester M1 4HD, GB
Priority Data:
62/384,11506.09.2016US
Title (EN) GENERATING AUDIO USING NEURAL NETWORKS
(FR) GÉNÉRATION D'AUDIO À L'AIDE DE RÉSEAUX NEURONAUX
Abstract: front page image
(EN) Methods, systems, and apparatus, including computer programs encoded on computer storage media, for generating an output sequence of audio data that comprises a respective audio sample at each of a plurality of time steps. One of the methods includes, for each of the time steps: providing a current sequence of audio data as input to a convolutional subnetwork, wherein the current sequence comprises the respective audio sample at each time step that precedes the time step in the output sequence, and wherein the convolutional subnetwork is configured to process the current sequence of audio data to generate an alternative representation for the time step; and providing the alternative representation for the time step as input to an output layer, wherein the output layer is configured to: process the alternative representation to generate an output that defines a score distribution over a plurality of possible audio samples for the time step.
(FR) L'invention concerne également des procédés, des systèmes et un appareil, comprenant des programmes informatiques codés sur des supports de stockage informatiques, pour générer une séquence de sortie de données audio qui comprend un échantillon audio respectif à chacune d'une pluralité d'étapes temporelles. L'un des procédés comprend, pour chacune des étapes de temps : la fourniture d'une séquence actuelle de données audio en tant qu'entrée à un sous-réseau de convolution, la séquence de courant comprenant l'échantillon audio respectif à chaque étape de temps qui précède l'étape de temps dans la séquence de sortie, et le sous-réseau de convolution étant configuré pour traiter la séquence actuelle de données audio pour générer une représentation alternative pour l'étape de temps; et fournir la représentation alternative pour l'étape de temps en tant qu'entrée à une couche de sortie, la couche de sortie étant configurée pour: traiter la représentation alternative pour générer une sortie qui définit une distribution de score sur une pluralité d'échantillons audio possibles pour l'étape de temps.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)