Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2023025607 - GÉNÉRATION AUTORÉGRESSIVE DE SÉQUENCES D'ÉLÉMENTS DE DONNÉES DÉFINISSANT DES ACTIONS À EFFECTUER PAR UN AGENT

Numéro de publication WO/2023/025607
Date de publication 02.03.2023
N° de la demande internationale PCT/EP2022/072731
Date du dépôt international 12.08.2022
CIB
G06N 3/04 2006.1
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
3Systèmes de calculateurs basés sur des modèles biologiques
02utilisant des modèles de réseaux neuronaux
04Architecture, p.ex. topologie d'interconnexion
G06N 3/08 2006.1
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
3Systèmes de calculateurs basés sur des modèles biologiques
02utilisant des modèles de réseaux neuronaux
08Méthodes d'apprentissage
CPC
G06N 3/045
G06N 3/084
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
084Back-propagation
G06N 3/088
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
088Non-supervised learning, e.g. competitive learning
Déposants
  • DEEPMIND TECHNOLOGIES LIMITED [GB]/[GB]
Inventeurs
  • REED, Scott Ellison
  • ZOLNA, Konrad
  • PARISOTTO, Emilio
  • EREZ, Tom
  • NOVIKOV, Alexander
  • RAE, Jack William
  • DENIL, Misha Man Ray
  • GOMES DE FREITAS, Joao Ferdinando
  • VINYALS, Oriol
  • GOMEZ, Sergio
  • EDWARDS, Ashley Deloris
  • BRUCE, Jacob
  • BARTH-MARON, Gabriel
Mandataires
  • FISH & RICHARDSON P.C.
Données relatives à la priorité
17/410,68924.08.2021US
63/341,34312.05.2022US
Langue de publication Anglais (en)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) AUTOREGRESSIVELY GENERATING SEQUENCES OF DATA ELEMENTS DEFINING ACTIONS TO BE PERFORMED BY AN AGENT
(FR) GÉNÉRATION AUTORÉGRESSIVE DE SÉQUENCES D'ÉLÉMENTS DE DONNÉES DÉFINISSANT DES ACTIONS À EFFECTUER PAR UN AGENT
Abrégé
(EN) Methods, systems, and apparatus, including computer programs encoded on a computer storage medium, for selecting actions to be performed by an agent to interact with an environment using an action selection neural network. In one aspect, a method comprises, at each time step in a sequence of time steps: generating a current representation of a state of a task being performed by the agent in the environment as of the current time step as a sequence of data elements; autoregressively generating a sequence of data elements representing a current action to be performed by the agent at the current time step; and after autoregressively generating the sequence of data elements representing the current action, causing the agent to perform the current action at the current time step.
(FR) L'invention concerne des procédés, des systèmes et des appareils, y compris des programmes informatiques codés sur un support de stockage informatique, pour sélectionner des actions à effectuer par un agent afin d'interagir avec un environnement à l'aide d'un réseau de neurones de sélection d'actions. Selon un aspect de l'invention, un procédé consiste, à chaque pas temporel d'une séquence de pas temporels, à : générer une représentation actuelle d'un état d'une tâche en train d'être effectuée par l'agent dans l'environnement jusqu'au pas temporel actuel sous la forme d'une séquence d'éléments de données ; générer de manière autorégressive une séquence d'éléments de données représentant une action actuelle à effectuer par l'agent au pas temporel actuel ; et après avoir généré de manière autorégressive la séquence d'éléments de données représentant l'action actuelle, amener l'agent à effectuer l'action actuelle au pas temporel actuel.
Documents de brevet associés
Dernières données bibliographiques dont dispose le Bureau international