Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020160252 - RECHERCHE D'UNE ARCHITECTURE DE RÉSEAU NEURONAL LIÉE À LA TÂCHE

Numéro de publication WO/2020/160252
Date de publication 06.08.2020
N° de la demande internationale PCT/US2020/015856
Date du dépôt international 30.01.2020
CIB
G06N 3/08 2006.1
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
3Systèmes de calculateurs basés sur des modèles biologiques
02utilisant des modèles de réseaux neuronaux
08Méthodes d'apprentissage
G06N 3/04 2006.1
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
3Systèmes de calculateurs basés sur des modèles biologiques
02utilisant des modèles de réseaux neuronaux
04Architecture, p.ex. topologie d'interconnexion
G06N 5/00 2006.1
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
5Systèmes de calculateurs utilisant des modèles basés sur la connaissance
G06N 7/00 2006.1
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
7Systèmes de calculateurs basés sur des modèles mathématiques spécifiques
CPC
G06N 3/0445
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0445Feedback networks, e.g. hopfield nets, associative networks
G06N 3/08
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
G06N 5/003
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
5Computer systems using knowledge-based models
003Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
G06N 7/005
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
7Computer systems based on specific mathematical models
005Probabilistic networks
Déposants
  • GOOGLE LLC [US]/[US]
Inventeurs
  • KOKIOPOULOU, Effrosyni
  • HAUTH, Anja
  • SBAIZ, Luciano
  • GESMUNDO, Andrea
  • BARTOK, Gabor
  • BERENT, Jesse
Mandataires
  • BUI, Kim Thien
  • PORTNOV, Michael
Données relatives à la priorité
2019010004830.01.2019GR
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) TASK-AWARE NEURAL NETWORK ARCHITECTURE SEARCH
(FR) RECHERCHE D'UNE ARCHITECTURE DE RÉSEAU NEURONAL LIÉE À LA TÂCHE
Abrégé
(EN)
A method of determining a final architecture for a task neural network for performing a target machine learning task is described. The target machine learning task is associated with a target training dataset. The method includes: generating a target meta-features tensor for the target training dataset, wherein the target meta-features tensor represents features of the target training dataset; repeatedly performing the following operations: generating, from a search space defining multiple architectures, a candidate architecture for the task neural network for performing the target machine learning task, and processing an input comprising the target meta-features tensor and data specifying the candidate architecture using an evaluator neural network to generate a candidate performance score that estimates a performance of the candidate architecture on the target machine learning task; and identifying, as the final architecture, a candidate architecture that has a maximum candidate performance score among the candidate architectures.
(FR)
L'invention concerne un procédé de détermination d'une architecture finale pour un réseau neuronal de tâches configuré pour effectuer une tâche d'apprentissage automatique particulière. La tâche d'apprentissage automatique cible est associée à un ensemble de données d'apprentissage cible. Le procédé consiste à : générer un tenseur de méta-caractéristiques cibles pour l'ensemble de données d'apprentissage cible, le tenseur de méta-caractéristiques cibles représentant des caractéristiques de l'ensemble de données d'apprentissage cible; exécuter de manière répétée les opérations suivantes : générer, à partir d'un espace de recherche définissant de multiples architectures, une architecture candidate pour le réseau neuronal de tâches pour effectuer la tâche d'apprentissage automatique cible, et traiter une entrée comprenant le tenseur de méta-caractéristiques cibles et des données spécifiant l'architecture candidate à l'aide d'un réseau neuronal évaluateur pour générer un score de performance candidat qui estime une performance de l'architecture candidate sur la tâche d'apprentissage automatique cible; et identifier, en tant qu'architecture finale, une architecture candidate qui a un score de performance candidat maximal parmi les architectures candidates.
Dernières données bibliographiques dont dispose le Bureau international