Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020242367 - ACCORD DE FILTRE À CAVITÉ UTILISANT UN APPRENTISSAGE D'IMITATION ET DE RENFORCEMENT

Numéro de publication WO/2020/242367
Date de publication 03.12.2020
N° de la demande internationale PCT/SE2020/050534
Date du dépôt international 27.05.2020
CIB
H03H 17/02 2006.1
HÉLECTRICITÉ
03CIRCUITS ÉLECTRONIQUES FONDAMENTAUX
HRÉSEAUX D'IMPÉDANCES, p.ex. CIRCUITS RÉSONNANTS; RÉSONATEURS
17Réseaux utilisant des techniques numériques
02Réseaux sélecteurs de fréquence
G06N 3/08 2006.1
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
3Systèmes de calculateurs basés sur des modèles biologiques
02utilisant des modèles de réseaux neuronaux
08Méthodes d'apprentissage
H01P 7/06 2006.1
HÉLECTRICITÉ
01ÉLÉMENTS ÉLECTRIQUES FONDAMENTAUX
PGUIDES D'ONDES; RÉSONATEURS, LIGNES OU AUTRES DISPOSITIFS DU TYPE GUIDE D'ONDES
7Résonateurs du type guide d'ondes
06Résonateurs à cavité
CPC
G06N 3/006
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
004Artificial life, i.e. computers simulating life
006based on simulated virtual individual or collective life forms, e.g. single "avatar", social simulations, virtual worlds or particle swarm optimisation
G06N 3/0454
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0454using a combination of multiple neural nets
G06N 3/088
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
088Non-supervised learning, e.g. competitive learning
Déposants
  • TELEFONAKTIEBOLAGET LM ERICSSON (PUBL) [SE]/[SE]
Inventeurs
  • LAN, Xiaoyu
  • LINDSTÅHL, Simon
Mandataires
  • LUNDQVIST, Alida
Données relatives à la priorité
62/853,40328.05.2019US
Langue de publication Anglais (en)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) CAVITY FILTER TUNING USING IMITATION AND REINFORCEMENT LEARNING
(FR) ACCORD DE FILTRE À CAVITÉ UTILISANT UN APPRENTISSAGE D'IMITATION ET DE RENFORCEMENT
Abrégé
(EN) A method for solving a sequential decision-making problem is provided. The method includes gathering state-action pair data from an expert policy; applying imitation learning to yield a cloned policy based on the gathered state-action pair data from the expert policy; and applying a reinforcement learning technique, wherein the reinforcement learning technique is initialized based on the cloned policy and has an output with one or more action to be performed for solving the sequential decision-making problem.
(FR) L'invention concerne un procédé pour résoudre un problème de prise de décision séquentielle. Le procédé comprend la collecte de données de paire état-action à partir d'une politique d'expert ; l'application d'un apprentissage d'imitation pour produire une politique clonée sur la base des données de paire état-action collectées à partir de la politique d'expert ; et l'application d'une technique d'apprentissage de renforcement, la technique d'apprentissage de renforcement étant initialisée sur la base de la politique clonée et ayant une sortie avec une ou plusieurs actions à exécuter pour résoudre le problème de prise de décision séquentielle.
Documents de brevet associés
Dernières données bibliographiques dont dispose le Bureau international