Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2018157625) PROCÉDÉ À BASE D'APPRENTISSAGE DE RENFORCEMENT POUR APPRENDRE À CLASSER, ET SERVEUR
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2018/157625 N° de la demande internationale : PCT/CN2017/111319
Date de publication : 07.09.2018 Date de dépôt international : 16.11.2017
CIB :
G06F 17/30 (2006.01)
G PHYSIQUE
06
CALCUL; COMPTAGE
F
TRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17
Equipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30
Recherche documentaire; Structures de bases de données à cet effet
Déposants :
华为技术有限公司 HUAWEI TECHNOLOGIES CO., LTD. [CN/CN]; 中国广东省深圳市 龙岗区坂田华为总部办公楼 Huawei Administration Building Bantian, Longgang District Shenzhen, Guangdong 518129, CN
Inventeurs :
李伟国 LI, Weiguo; CN
蒋欣 JIANG, Xin; CN
李航 LI, Hang; CN
Mandataire :
广州三环专利商标代理有限公司 SCIHEAD IP LAW FIRM; 中国广东省广州市 越秀区先烈中路80号汇华商贸大厦1508室 Room 1508, Huihua Commercial & Trade Building No. 80, Xianlie Zhong Road, Yuexiu District Guangzhou, Guangdong 510070, CN
Données relatives à la priorité :
201710114414.028.02.2017CN
Titre (EN) REINFORCEMENT LEARNING-BASED METHOD FOR LEARNING TO RANK AND SERVER
(FR) PROCÉDÉ À BASE D'APPRENTISSAGE DE RENFORCEMENT POUR APPRENDRE À CLASSER, ET SERVEUR
(ZH) 基于强化学习的排序学习方法及服务器
Abrégé :
(EN) A method for learning to rank on the basis of reinforcement learning, comprising: a server acquires a historical query word and M documents corresponding to the historical query word (S201); the server ranks the M documents to obtain a target ranked document list (S202); the server acquires a rank effect evaluation value for the target ranked document list (S203); the server uses the historical query word, the M documents, the target ranked document list and the rank effect evaluation value as a training sample and puts same into a training sample set (S204); and when the number of training samples in the training sample set is greater than a preset number, the server uses a reinforcement learning algorithm to train the training sample set to obtain a ranking model (S205). With the method, a rank index may be optimized accurately, thereby improving the satisfaction level of a user regarding the rank result of a ranked document list corresponding to a query word.
(FR) L'invention concerne un procédé permettant d'apprendre à classer sur la base d'un apprentissage de renforcement, comprenant les étapes suivantes : un serveur acquiert un mot d'interrogation historique et M documents correspondant au mot d'interrogation historique (S201) ; le serveur classe les M documents pour obtenir une liste de documents classés cibles (S202) ; le serveur acquiert une valeur d'évaluation d'effet de classement pour la liste des documents classés cibles (S203) ; le serveur utilise le mot d'interrogation historique, les M documents, la liste de documents classés cibles et la valeur d'évaluation d'effet de classement en tant qu'échantillon d'apprentissage et les met dans un ensemble d'échantillons d'apprentissage (S204) ; et lorsque le nombre d'échantillons d'apprentissage dans l'ensemble d'échantillons d'apprentissage est supérieur à un nombre prédéfini, le serveur utilise un algorithme d'apprentissage de renforcement pour apprendre à l'ensemble d'échantillons d'apprentissage à obtenir un modèle de classement (S205). À l'aide du procédé, un indice de classement peut être optimisé avec précision, améliorant ainsi le niveau de satisfaction d'un utilisateur concernant le résultat de classement d'une liste de documents classés correspondant à un mot d'interrogation.
(ZH) 一种基于强化学习的排序学习方法,包括:服务器获取历史查询词,并获取与历史查询词相对应的M个文档(S201);服务器对M个文档进行排序以获取目标文档排序列表(S202);服务器获取目标文档排序列表的排序效果评估值(S203);服务器将历史查询词、M个文档、目标文档排序列表和排序效果评估值作为一个训练样本,并放入训练样本集合中(S204);当训练样本集中的训练样本的数量大于预设数量时,服务器利用强化学习算法对所述训练样本集合进行训练以获取所述排序模型(S205)。采用本方法有利于精确优化排序指标,从而提高用户对查询词对应的文档排序列表的排序结果的满意度。
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)