Processing

Please wait...

Settings

Settings

Goto Application

1. JP2021185493 - ACTION SELECTION FOR ENHANCED LEARNING USING NEURAL NETWORK

Office
Japan
Application Number 2021127574
Application Date 03.08.2021
Publication Number 2021185493
Publication Date 09.12.2021
Publication Kind A
IPC
G06N 3/04
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architecture, e.g. interconnection topology
CPC
G06N 3/006
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
004Artificial life, i.e. computers simulating life
006based on simulated virtual individual or collective life forms, e.g. single "avatar", social simulations, virtual worlds or particle swarm optimisation
G06N 3/0445
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0445Feedback networks, e.g. hopfield nets, associative networks
G06N 3/0454
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0454using a combination of multiple neural nets
G06N 3/08
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
G06N 3/04
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
Applicants DEEPMIND TECHNOLOGIES LITD
ディープマインド テクノロジーズ リミテッド
Inventors SIMON OSINDERO
サイモン・オシンデロ
KORAY KAVUKCUOGLU
コーレイ・カヴクチュオグル
ALEXANDER VEZHNEVETS
アレキサンダー・ヴェズネヴェッツ
Agents 村山 靖彦
実広 信哉
阿部 達彦
Priority Data 62/463,532 24.02.2017 US
Title
(EN) ACTION SELECTION FOR ENHANCED LEARNING USING NEURAL NETWORK
(JA) ニューラルネットワークを使用する強化学習のための行動選択
Abstract
(EN)

PROBLEM TO BE SOLVED: To provide a method for selecting an action to be implemented by an agent interacting with an environment.

SOLUTION: A system includes a manager neural network subsystem and a worker manager neural network subsystem. The manager subsystem is configured to generate a final target vector regarding a time step in each of a plurality of time steps. The worker subsystem is configured to generate an action score for each action in a prescribed action set by using the final target vector generated by the manager subsystem in each of the plurality of time steps.

SELECTED DRAWING: Figure 1

COPYRIGHT: (C)2022,JPO&INPIT


(JA)

【課題】環境と相互作用するエージェントによって遂行される行動を選択する方法を提供する。
【解決手段】このシステムは、マネージャニューラルネットワークサブシステムおよびワーカニューラルネットワークサブシステムを備える。マネージャサブシステムは、複数の時間ステップの各々において、時間ステップに関する最終的な目標ベクトルを生成するように構成されている。ワーカサブシステムは、複数の時間ステップの各々において、マネージャサブシステムによって生成された最終的な目標ベクトルを使用して、所定の行動セットにおける各行動に関するそれぞれの行動スコアを生成するように構成されている。
【選択図】図1