Please wait...
Please let us know your thoughts on PATENTSCOPE or tell us what you feel is missing or how we could improve it.
PROBLEM TO BE SOLVED: To provide a method for selecting an action to be implemented by an agent interacting with an environment.
SOLUTION: A system includes a manager neural network subsystem and a worker manager neural network subsystem. The manager subsystem is configured to generate a final target vector regarding a time step in each of a plurality of time steps. The worker subsystem is configured to generate an action score for each action in a prescribed action set by using the final target vector generated by the manager subsystem in each of the plurality of time steps.
SELECTED DRAWING: Figure 1
COPYRIGHT: (C)2022,JPO&INPIT
【課題】環境と相互作用するエージェントによって遂行される行動を選択する方法を提供する。【解決手段】このシステムは、マネージャニューラルネットワークサブシステムおよびワーカニューラルネットワークサブシステムを備える。マネージャサブシステムは、複数の時間ステップの各々において、時間ステップに関する最終的な目標ベクトルを生成するように構成されている。ワーカサブシステムは、複数の時間ステップの各々において、マネージャサブシステムによって生成された最終的な目標ベクトルを使用して、所定の行動セットにおける各行動に関するそれぞれの行動スコアを生成するように構成されている。【選択図】図1