Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Tuesday 25.01.2022 at 12:00 PM CET
Settings

Settings

Goto Application

1. WO2022009859 - REINFORCEMENT LEARNING DEVICE, REINFORCEMENT LEARNING SYSTEM, OBJECT MANIPULATION DEVICE, MODEL GENERATION METHOD, AND REINFORCEMENT LEARNING PROGRAM

Publication Number WO/2022/009859
Publication Date 13.01.2022
International Application No. PCT/JP2021/025392
International Filing Date 06.07.2021
IPC
B25J 13/08 2006.1
BPERFORMING OPERATIONS; TRANSPORTING
25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; HANDLES FOR HAND IMPLEMENTS; WORKSHOP EQUIPMENT; MANIPULATORS
JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
13Controls for manipulators
08by means of sensing devices, e.g. viewing or touching devices
Applicants
  • 株式会社Preferred Networks PREFERRED NETWORKS, INC. [JP]/[JP]
Inventors
  • 藤田 康博 FUJITA, Yasuhiro
Agents
  • 伊東 忠重 ITOH, Tadashige
  • 伊東 忠彦 ITOH, Tadahiko
Priority Data
2020-11934910.07.2020JP
Publication Language Japanese (ja)
Filing Language Japanese (JA)
Designated States
Title
(EN) REINFORCEMENT LEARNING DEVICE, REINFORCEMENT LEARNING SYSTEM, OBJECT MANIPULATION DEVICE, MODEL GENERATION METHOD, AND REINFORCEMENT LEARNING PROGRAM
(FR) DISPOSITIF D'APPRENTISSAGE PAR RENFORCEMENT, SYSTÈME D'APPRENTISSAGE PAR RENFORCEMENT, DISPOSITIF DE MANIPULATION D'OBJET, PROCÉDÉ DE GÉNÉRATION DE MODÈLE ET PROGRAMME D'APPRENTISSAGE PAR RENFORCEMENT
(JA) 強化学習装置、強化学習システム、物体操作装置、モデル生成方法及び強化学習プログラム
Abstract
(EN) Provided are a reinforcement learning device, a reinforcement learning system, an object manipulation device, a model generation method, and a reinforcement learning program, whereby the probability of success of a prescribed manipulation on an object can be increased. This reinforcement learning device has at least one memory and at least one processor, the at least one processor being configured so as to be capable of: inputting information relating to a captured image captured by an imaging device that changes in at least position or orientation thereof, and information relating to a target object image indicating an object to be manipulated by an end effector, to a training model that outputs information for controlling the operation of the end effector; and updating a parameter of the training model on the basis of the result of manipulation of the object for a case where the operation of the end effector is controlled on the basis of the information outputted by the training model.
(FR) L'invention concerne un dispositif d'apprentissage par renforcement, un système d'apprentissage par renforcement, un dispositif de manipulation d'objet, un procédé de génération de modèle et un programme d'apprentissage par renforcement, la probabilité de réussite d'une manipulation prescrite sur un objet pouvant être augmentée. Ce dispositif d'apprentissage par renforcement présente au moins une mémoire et au moins un processeur, l'au moins un processeur étant configuré de manière à pouvoir : entrer des informations relatives à une image capturée capturée par un dispositif d'imagerie qui change dans au moins une position ou une orientation de celui-ci, et des informations concernant une image d'objet cible indiquant un objet devant être manipulé par un effecteur terminal, dans un modèle d'apprentissage qui délivre des informations destinées à commander le fonctionnement de l'effecteur terminal; et la mise à jour d'un paramètre du modèle d'apprentissage sur la base du résultat de manipulation de l'objet pour un cas où le fonctionnement de l'effecteur d'extrémité est commandé sur la base des informations délivrées par le modèle d'apprentissage.
(JA) 物体に対する所定の操作の成功確率を上げることが可能な、強化学習装置、強化学習システム、物体操作装置、モデル生成方法及び強化学習プログラムを提供する。強化学習装置は、少なくとも1つのメモリと、少なくとも1つのプロセッサと、を有し、前記少なくとも1つのプロセッサは、少なくとも位置及び姿勢のいずれかが変化する撮像装置により撮影された撮影画像に関する情報と、エンドエフェクタにより操作される操作対象の物体を示す目標物体画像に関する情報とを、前記エンドエフェクタの動作を制御するための情報を出力する訓練モデルに入力することと、前記訓練モデルにより出力された情報に基づき前記エンドエフェクタの動作が制御された場合の、前記物体に対する操作結果に基づいて、前記訓練モデルのパラメータを更新することとを実行可能に構成される。
Latest bibliographic data on file with the International Bureau