このアプリケーションの一部のコンテンツは現時点では利用できません。
このような状況が続く場合は、にお問い合わせくださいフィードバック & お問い合わせ
1. (WO2018220829) ポリシー生成装置及び車両
国際事務局に記録されている最新の書誌情報    第三者情報を提供

国際公開番号: WO/2018/220829 国際出願番号: PCT/JP2017/020643
国際公開日: 06.12.2018 国際出願日: 02.06.2017
予備審査請求日: 02.10.2018
IPC:
G08G 1/16 (2006.01) ,B60W 30/10 (2006.01)
G 物理学
08
信号
G
交通制御システム
1
道路上の車両に対する交通制御システム
16
衝突防止システム
B 処理操作;運輸
60
車両一般
W
異なる種類または異なる機能の車両用サブユニットの関連制御;ハイブリッド車両に特に適した制御システム;特定の単一のサブユニットの制御に関するものではない、特定の目的のための道路走行用車両の運動制御システム
30
特定の単一のサブユニットの制御に関するものではない道路走行用車両の運動制御システムであって目的によって特徴づけられるもの(例.車両用サブユニットの関連制御を用いたシステムにおける目的)
10
走行軌跡維持制御
出願人:
本田技研工業株式会社 HONDA MOTOR CO., LTD. [JP/JP]; 東京都港区南青山二丁目1番1号 1-1, Minami-Aoyama 2-chome, Minato-ku, Tokyo 1078556, JP
発明者:
喜住 祐紀 KIZUMI, Yuki; JP
代理人:
大塚 康徳 OHTSUKA, Yasunori; JP
大塚 康弘 OHTSUKA, Yasuhiro; JP
高柳 司郎 TAKAYANAGI, Jiro; JP
木村 秀二 KIMURA, Shuji; JP
優先権情報:
発明の名称: (EN) POLICY GENERATION DEVICE AND VEHICLE
(FR) VÉHICULE ET DISPOSITIF DE GÉNÉRATION DE POLITIQUE
(JA) ポリシー生成装置及び車両
要約:
(EN) This device for generating a policy for determining the trajectory of a vehicle in autonomous driving is provided with: a reward estimator; and a processing unit which generates a policy such that the expected value of the reward, said expected value being obtained by inputting the state around the vehicle and the actions of the vehicle into the reward estimator, becomes high. The reward is updated on the basis of the actual actions carried out by a prescribed driver. The actions of the vehicle inputted into the reward estimator are updated on the basis of the policy.
(FR) La présente invention concerne un dispositif de génération d'une politique permettant de déterminer la trajectoire d'un véhicule en conduite autonome, qui est pourvu : d'un estimateur de récompense; et d'une unité de traitement qui génère une politique de telle sorte que la valeur attendue de la récompense, ladite valeur attendue étant obtenue par l'entrée de l'état autour du véhicule et des actions du véhicule dans l'estimateur de récompense, devient élevée. La récompense est mise à jour sur la base des actions actuelles effectuées par un conducteur prescrit. Les actions du véhicule entrées dans l'estimateur de récompense sont mises à jour sur la base de la politique.
(JA) 車両の自動運転における軌道を決定するためのポリシーを生成する装置は、報酬推定器と、車両の周囲の状況と車両の行動とを報酬推定器へ入力することによって得られる報酬の期待値が高くなるようにポリシーを生成する処理部と、を備える。報酬は、所定の運転者による実際の行動に基づいて更新される。報酬推定器に入力される車両の行動は、ポリシーに基づいて更新される。
front page image
指定国: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
アフリカ広域知的所有権機関(ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
ユーラシア特許庁(EAPO) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
欧州特許庁(EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
アフリカ知的所有権機関(OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
国際公開言語: 日本語 (JA)
国際出願言語: 日本語 (JA)