Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018205245) STRATEGY NETWORK MODEL GENERATION METHOD AND APPARATUS FOR AUTOMATIC VEHICLE DRIVING
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/205245 International Application No.: PCT/CN2017/084081
Publication Date: 15.11.2018 International Filing Date: 12.05.2017
IPC:
G06N 5/02 (2006.01) ,G06N 99/00 (2010.01)
[IPC code unknown for G06N 5/02][IPC code unknown for G06N 99]
Applicants:
中国科学院深圳先进技术研究院 SHENZHEN INSTITUTES OF ADVANCED TECHNOLOGY CHINESE ACADEMY OF SCIENCES [CN/CN]; 中国广东省深圳市 南山区西丽深圳大学城学苑大道1068号 1068 Xueyuan Avenue, Xili University Town, Nanshan District Shenzhen, Guangdong 518055, CN
Inventors:
李慧云 LI, Huiyun; CN
王峥 WANG, Zheng; CN
刘玢玢 LIU, Fenfen; CN
Agent:
深圳青年人专利商标代理有限公司 SHENZHEN YOUTH PATENT AND TRADEMARK AGENCY LTD.; 中国广东省深圳市 罗湖区深南东路5045号深业中心大厦2502-2503 Room 2502-2503, Shenye Center Building No. 5045, Shennan East Road, Luohu Shenzhen, Guangdong 518010, CN
Priority Data:
Title (EN) STRATEGY NETWORK MODEL GENERATION METHOD AND APPARATUS FOR AUTOMATIC VEHICLE DRIVING
(FR) PROCÉDÉ ET APPAREIL DE GÉNÉRATION DE MODÈLE DE RÉSEAU DE STRATÉGIE POUR CONDUITE AUTOMATIQUE DE VÉHICULE
(ZH) 一种用于车辆自动驾驶的策略网络模型的生成方法及装置
Abstract:
(EN) A strategy network model generation method and apparatus for automatic vehicle driving. The method comprises: forming vehicle state information collected at each test moment into a state information set, and processing the state information set, so as to obtain a feature state information set (S101); searching, according to a pre-set reward value function and a pre-constructed vehicle action set, for a vehicle action obtaining the maximum reward value from each piece of state information in the feature state information set (S102); training a network model of an extreme learning machine according to the feature state information set, the maximum reward value corresponding to each piece of state information in the feature state information set, and the vehicle action obtaining the maximum reward value (S103); and generating, according to a training result of the network model of the extreme learning machine, a strategy network model for automatic vehicle driving (S104), thereby effectively reducing the consumption of computation resources, and effectively improving the generation efficiency of the strategy network model for automatic vehicle driving.
(FR) La présente invention concerne un procédé et un appareil de génération de modèle de réseau de stratégie pour conduite automatique de véhicule. Le procédé comprend : former des informations d'état de véhicule collectées à chaque moment d'essai en un ensemble d'informations d'état, et traiter l'ensemble d'informations d'état, de façon à obtenir un ensemble d'informations d'état de caractéristique (S101) ; rechercher, selon une fonction de valeur de récompense prédéfinie et un ensemble d'actions de véhicule préconstruit, pour une action de véhicule qui obtient la valeur de récompense maximum à partir de chaque élément d'informations d'état dans l'ensemble d'informations d'état de caractéristique (S102) ; réaliser l'apprentissage d'un modèle de réseau d'une machine d'apprentissage extrême selon l'ensemble d'informations d'état de caractéristique, la valeur de récompense maximum qui correspond à chaque élément d'informations d'état dans l'ensemble d'informations d'état de caractéristique, et l'action de véhicule qui obtient la valeur de récompense maximum (S103) ; et générer, selon un résultat d'apprentissage du modèle de réseau de la machine d'apprentissage extrême, un modèle de réseau de stratégie pour la conduite automatique de véhicule (S104), ce qui permet de réduire efficacement la consommation de ressources de calcul, et d'améliorer efficacement l'efficacité de génération du modèle de réseau de stratégie pour une conduite automatique de véhicule.
(ZH) 提供了一种用于车辆自动驾驶的策略网络模型的生成方法及装置,所述方法包括:将每个试验时刻采集到的车辆状态信息构成状态信息集,对状态信息集进行处理,获得特征状态信息集(S101);根据预设的回报值函数和预先构建的车辆动作集,查找在特征状态信息集的每个状态信息下获得最大回报值的车辆动作(S102);根据特征状态信息集、特征状态信息集中每个状态信息对应的最大回报值和获得最大回报值的车辆动作,训练极限学习机的网络模型(S103);根据极限学习机的网络模型的训练结果,生成用于车辆自动驾驶的策略网络模型(S104),从而有效地降低了计算资源的消耗,有效地提高了车辆自动驾驶策略网络模型的生成效率。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)