Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020112186 - SYSTÈME AUTONOME COMPRENANT UN MODÈLE DU MONDE À APPRENTISSAGE CONTINU ET PROCÉDÉS ASSOCIÉS

Numéro de publication WO/2020/112186
Date de publication 04.06.2020
N° de la demande internationale PCT/US2019/047758
Date du dépôt international 22.08.2019
CIB
G06N 3/08 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
3Systèmes de calculateurs basés sur des modèles biologiques
02utilisant des modèles de réseaux neuronaux
08Méthodes d'apprentissage
G06N 3/04 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
3Systèmes de calculateurs basés sur des modèles biologiques
02utilisant des modèles de réseaux neuronaux
04Architecture, p.ex. topologie d'interconnexion
CPC
G06F 17/15
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
10Complex mathematical operations
15Correlation function computation ; including computation of convolution operations
G06N 3/006
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
004Artificial life, i.e. computers simulating life
006based on simulated virtual individual or collective life forms, e.g. single "avatar", social simulations, virtual worlds or particle swarm optimisation
G06N 3/0445
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0445Feedback networks, e.g. hopfield nets, associative networks
G06N 3/0454
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0454using a combination of multiple neural nets
G06N 3/0472
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0472using probabilistic elements, e.g. p-rams, stochastic processors
Déposants
  • HRL LABORATORIES, LLC [US]/[US]
Inventeurs
  • KETZ, Nicholas, A.
  • PILLY, Praveen, K.
  • KOLOURI, Soheil
  • MARTIN, Charles, E.
  • HOWARD, Michael, D.
Mandataires
  • SZAKALSKI, Dustin, R.
Données relatives à la priorité
62/749,81924.10.2018US
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) AUTONOMOUS SYSTEM INCLUDING A CONTINUALLY LEARNING WORLD MODEL AND RELATED METHODS
(FR) SYSTÈME AUTONOME COMPRENANT UN MODÈLE DU MONDE À APPRENTISSAGE CONTINU ET PROCÉDÉS ASSOCIÉS
Abrégé
(EN)
An autonomous or semi-autonomous system includes a temporal prediction network configured to process a first set of samples from an environment of the system during performance of a first task, a controller configured to process the first set of samples from the environment and a hidden state output by the temporal prediction network, a preserved copy of the temporal prediction network, and a preserved copy of the controller. The preserved copy of the temporal prediction network and the preserved copy of the controller are configured to generate simulated rollouts, and the system is configured to interleave the simulated rollouts with a second set of samples from the environment during performance of a second task to preserve knowledge of the temporal prediction network for performing the first task.
(FR)
La présente invention concerne un système autonome ou semi-autonome qui comprend un réseau de prédiction temporelle configuré pour traiter un premier ensemble d'échantillons d'un environnement du système pendant la réalisation d'une première tâche, un contrôleur configuré pour traiter le premier ensemble d'échantillons de l'environnement et un état caché délivré par le réseau de prédiction temporelle, une copie préservée du réseau de prédiction temporelle et une copie préservée du contrôleur. La copie préservée du réseau de prédiction temporelle et la copie préservée du contrôleur sont configurées pour générer des transferts simulés, et le système est configuré pour entrelacer les transferts simulés avec un second ensemble d'échantillons de l'environnement pendant la réalisation d'une seconde tâche pour préserver la connaissance du réseau de prédiction temporelle permettant de réaliser la première tâche.
Dernières données bibliographiques dont dispose le Bureau international