Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018157625) REINFORCEMENT LEARNING-BASED METHOD FOR LEARNING TO RANK AND SERVER
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/157625 International Application No.: PCT/CN2017/111319
Publication Date: 07.09.2018 International Filing Date: 16.11.2017
IPC:
G06F 17/30 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
30
Information retrieval; Database structures therefor
Applicants:
华为技术有限公司 HUAWEI TECHNOLOGIES CO., LTD. [CN/CN]; 中国广东省深圳市 龙岗区坂田华为总部办公楼 Huawei Administration Building Bantian, Longgang District Shenzhen, Guangdong 518129, CN
Inventors:
李伟国 LI, Weiguo; CN
蒋欣 JIANG, Xin; CN
李航 LI, Hang; CN
Agent:
广州三环专利商标代理有限公司 SCIHEAD IP LAW FIRM; 中国广东省广州市 越秀区先烈中路80号汇华商贸大厦1508室 Room 1508, Huihua Commercial & Trade Building No. 80, Xianlie Zhong Road, Yuexiu District Guangzhou, Guangdong 510070, CN
Priority Data:
201710114414.028.02.2017CN
Title (EN) REINFORCEMENT LEARNING-BASED METHOD FOR LEARNING TO RANK AND SERVER
(FR) PROCÉDÉ À BASE D'APPRENTISSAGE DE RENFORCEMENT POUR APPRENDRE À CLASSER, ET SERVEUR
(ZH) 基于强化学习的排序学习方法及服务器
Abstract:
(EN) A method for learning to rank on the basis of reinforcement learning, comprising: a server acquires a historical query word and M documents corresponding to the historical query word (S201); the server ranks the M documents to obtain a target ranked document list (S202); the server acquires a rank effect evaluation value for the target ranked document list (S203); the server uses the historical query word, the M documents, the target ranked document list and the rank effect evaluation value as a training sample and puts same into a training sample set (S204); and when the number of training samples in the training sample set is greater than a preset number, the server uses a reinforcement learning algorithm to train the training sample set to obtain a ranking model (S205). With the method, a rank index may be optimized accurately, thereby improving the satisfaction level of a user regarding the rank result of a ranked document list corresponding to a query word.
(FR) L'invention concerne un procédé permettant d'apprendre à classer sur la base d'un apprentissage de renforcement, comprenant les étapes suivantes : un serveur acquiert un mot d'interrogation historique et M documents correspondant au mot d'interrogation historique (S201) ; le serveur classe les M documents pour obtenir une liste de documents classés cibles (S202) ; le serveur acquiert une valeur d'évaluation d'effet de classement pour la liste des documents classés cibles (S203) ; le serveur utilise le mot d'interrogation historique, les M documents, la liste de documents classés cibles et la valeur d'évaluation d'effet de classement en tant qu'échantillon d'apprentissage et les met dans un ensemble d'échantillons d'apprentissage (S204) ; et lorsque le nombre d'échantillons d'apprentissage dans l'ensemble d'échantillons d'apprentissage est supérieur à un nombre prédéfini, le serveur utilise un algorithme d'apprentissage de renforcement pour apprendre à l'ensemble d'échantillons d'apprentissage à obtenir un modèle de classement (S205). À l'aide du procédé, un indice de classement peut être optimisé avec précision, améliorant ainsi le niveau de satisfaction d'un utilisateur concernant le résultat de classement d'une liste de documents classés correspondant à un mot d'interrogation.
(ZH) 一种基于强化学习的排序学习方法,包括:服务器获取历史查询词,并获取与历史查询词相对应的M个文档(S201);服务器对M个文档进行排序以获取目标文档排序列表(S202);服务器获取目标文档排序列表的排序效果评估值(S203);服务器将历史查询词、M个文档、目标文档排序列表和排序效果评估值作为一个训练样本,并放入训练样本集合中(S204);当训练样本集中的训练样本的数量大于预设数量时,服务器利用强化学习算法对所述训练样本集合进行训练以获取所述排序模型(S205)。采用本方法有利于精确优化排序指标,从而提高用户对查询词对应的文档排序列表的排序结果的满意度。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)