処理中

しばらくお待ちください...

PATENTSCOPE は、メンテナンスのため次の日時に数時間サービスを休止します。サービス休止: 土曜日 31.10.2020 (7:00 午前 CET)
設定

設定

出願の表示

1. WO2020183864 - 自動操縦ロボットを制御する操作推論学習モデルの学習システム及び学習方法

公開番号 WO/2020/183864
公開日 17.09.2020
国際出願番号 PCT/JP2019/050747
国際出願日 25.12.2019
IPC
G01M 17/007 2006.01
G物理学
01測定;試験
M機械または構造物の静的または動的つり合い試験;他に分類されない構造物または装置の試験
17車両の試験
007車輪付車両または無限軌道車両
G06N 3/02 2006.01
G物理学
06計算;計数
N特定の計算モデルに基づくコンピュータ・システム
3生物学的モデルに基づくコンピュータシステム
02ニューラルネットワークモデルを用いるもの
G06N 20/00 2019.01
G物理学
06計算;計数
N特定の計算モデルに基づくコンピュータ・システム
20機械学習
CPC
G01M 17/007
GPHYSICS
01MEASURING; TESTING
MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
17Testing of vehicles
007Wheeled or endless-tracked vehicles
G06N 20/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
20Machine learning
G06N 3/02
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
出願人
  • 株式会社明電舎 MEIDENSHA CORPORATION [JP]/[JP]
発明者
  • 吉田 健人 YOSHIDA Kento
  • 深井 寛修 FUKAI Hironobu
  • 望月 凛平 MOCHIZUKI Rinpei
代理人
  • 園田・小林特許業務法人 SONODA & KOBAYASHI INTELLECTUAL PROPERTY LAW
優先権情報
2019-04584813.03.2019JP
公開言語 (言語コード) 日本語 (JA)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) LEARNING SYSTEM AND LEARNING METHOD FOR OPERATION INFERENCE LEARNING MODEL FOR CONTROLLING AUTOMATIC DRIVING ROBOT
(FR) SYSTÈME D'APPRENTISSAGE ET PROCÉDÉ D'APPRENTISSAGE POUR MODÈLE D'APPRENTISSAGE DE DÉDUCTION DE FONCTIONNEMENT PERMETTANT DE COMMANDER UN ROBOT DE CONDUITE AUTOMATIQUE
(JA) 自動操縦ロボットを制御する操作推論学習モデルの学習システム及び学習方法
要約
(EN)
Provided is a learning system 10 that is for an operation inference learning model 70 for controlling an automatic driving robot 4, carries out reinforcement learning of the operation inference learning model 70, and comprises the operation inference learning model 70, which is for using a travel state of a vehicle 2 including the vehicle speed to infer operation of the vehicle 2 that will result in the vehicle 2 traveling according to a specified command vehicle speed, and the automatic driving robot 4, which is mounted in the vehicle 2 and causes the vehicle 2 to travel on the basis of the operation, wherein advance reinforcement learning of the operation inference learning model 70 is carried out through the application, to the operation inference learning model 70, of a simulated travel state output by a vehicle learning model 60, and after the advance reinforcement learning has finished, additional reinforcement learning of the operation inference learning model 70 is carried out through the application, to the operation inference learning model 70, of a travel state acquired by causing the vehicle 2 to travel on the basis of the operation inferred by the operation inference learning model 70.
(FR)
L'invention concerne un système d'apprentissage (10) qui est destiné à un modèle d'apprentissage de déduction de fonctionnement (70) permettant de commander un robot de conduite automatique (4). Le système d'apprentissage (10) réalise un apprentissage par renforcement du modèle d'apprentissage de déduction de fonctionnement (70). Le système d'apprentissage (10) intègre le modèle d'apprentissage de déduction de fonctionnement (70). Le modèle d'apprentissage de déduction de fonctionnement (70) est destiné à utiliser un état de circulation d'un véhicule (2), notamment la vitesse du véhicule, pour déduire le fonctionnement du véhicule (2) qui aboutira à la circulation du véhicule (2) en fonction d'une vitesse de véhicule de commande spécifiée, et à utiliser un état de circulation du robot de conduite automatique (4) qui est monté dans le véhicule (2) et fait circuler le véhicule (2) sur la base du fonctionnement. Un apprentissage par renforcement à l'avance du modèle d'apprentissage de déduction de fonctionnement (70) est effectué par l'application au modèle d'apprentissage de déduction de fonctionnement (70) d'un état de circulation simulé sorti par un modèle d'apprentissage de véhicule (60). Une fois l'apprentissage par renforcement à l'avance fini, un autre apprentissage par renforcement du modèle d'apprentissage de déduction de fonctionnement (70) est effectué par l'application au modèle d'apprentissage de déduction de fonctionnement (70) d'un état de circulation acquis en faisant circuler le véhicule (2) sur la base du fonctionnement déduit par le modèle d'apprentissage de déduction de fonctionnement (70).
(JA)
車速を含む車両2の走行状態を基に、前記車両2を規定された指令車速に従って走行させるような、前記車両2の操作を推論する操作推論学習モデル70と、前記車両2に搭載されて、前記操作を基に当該車両2を走行させる自動操縦ロボット4を備え、前記操作推論学習モデル70を強化学習する、自動操縦ロボット4を制御する操作推論学習モデル70の学習システム10であって、前記車両学習モデル60が出力した前記模擬走行状態を前記操作推論学習モデル70に適用することで、前記操作推論学習モデル70を事前に強化学習し、当該事前の強化学習が終了した後に、前記操作推論学習モデル70が推論した前記操作を基に前記車両2を走行させて取得された前記走行状態を前記操作推論学習モデル70に適用することで、前記操作推論学習モデル70を更に強化学習する、自動操縦ロボット4を制御する操作推論学習モデル70の学習システム10を提供する。
国際事務局に記録されている最新の書誌情報