Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018123606) LEARNING DEVICE AND LEARNING METHOD
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/123606 International Application No.: PCT/JP2017/044839
Publication Date: 05.07.2018 International Filing Date: 14.12.2017
IPC:
G06N 99/00 (2010.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
N
COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
99
Subject matter not provided for in other groups of this subclass
Applicants:
ソニー株式会社 SONY CORPORATION [JP/JP]; 東京都港区港南1丁目7番1号 1-7-1, Konan, Minato-ku, Tokyo 1080075, JP
Inventors:
中田 健人 NAKADA Kento; JP
成平 拓也 NARIHIRA Takuya; JP
鈴木 洋貴 SUZUKI Hirotaka; JP
大里 章人 OSATO Akihito; JP
Agent:
西川 孝 NISHIKAWA Takashi; JP
稲本 義雄 INAMOTO Yoshio; JP
Priority Data:
2016-25190126.12.2016JP
Title (EN) LEARNING DEVICE AND LEARNING METHOD
(FR) DISPOSITIF D'APPRENTISSAGE ET PROCÉDÉ D'APPRENTISSAGE
(JA) 学習装置および学習方法
Abstract:
(EN) The present disclosure relates to a learning device and learning method with which it is possible to easily correct a reinforcement learning model on the basis of a user input. A display control unit causes a display unit to display reinforcement learning model information which relates to a reinforcement learning model. A correction unit corrects the reinforcement learning model on the basis of an input from a user regarding the reinforcement learning model information. The present disclosure may be applied to, for example, a personal computer (PC) which corrects a reinforcement learning model on the basis of an input from a user and which learns, by reinforcement learning, a movement policy of an agent using the corrected reinforcement learning model.
(FR) La présente invention concerne un dispositif d'apprentissage et un procédé d'apprentissage avec lesquels il est possible de corriger facilement un modèle d'apprentissage de renforcement sur la base d'une entrée d'utilisateur. Une unité de commande d'affichage amène une unité d'affichage à afficher des informations de modèle d'apprentissage de renforcement qui concernent un modèle d'apprentissage de renforcement. Une unité de correction corrige le modèle d'apprentissage de renforcement sur la base d'une entrée provenant d'un utilisateur concernant les informations de modèle d'apprentissage de renforcement. La présente invention peut être appliquée, par exemple, à un ordinateur personnel (PC) qui corrige un modèle d'apprentissage de renforcement sur la base d'une entrée provenant d'un utilisateur et qui apprend, par apprentissage de renforcement, une politique de mouvement d'un agent à l'aide du modèle d'apprentissage de renforcement corrigé.
(JA) 本開示は、ユーザ入力に基づいて強化学習モデルを容易に修正することができるようにする学習装置および学習方法に関する。 表示制御部は、強化学習モデルに関する強化学習モデル情報を表示部に表示させる。修正部は、強化学習モデル情報に対するユーザの入力に基づいて、強化学習モデルを修正する。本開示は、例えば、ユーザからの入力に基づいて強化学習モデルを修正し、修正後の強化学習モデルを用いてエージェントの移動方策を強化学習するパーソナルコンピュータ(PC)等に適用することができる。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Japanese (JA)
Filing Language: Japanese (JA)