Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018218405) SIMILAR USER SELECTING METHOD AND DEVICE
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/218405 International Application No.: PCT/CN2017/086285
Publication Date: 06.12.2018 International Filing Date: 27.05.2017
IPC:
G06F 17/30 (2006.01)
[IPC code unknown for G06F 17/30]
Applicants:
深圳大学 SHENZHEN UNIVERSITY [CN/CN]; 中国广东省深圳市 南山区南海大道3688号 Nanhai Ave.3688 Nanshan Shenzhen, Guangdong 518060, CN
Inventors:
王娜 WANG, Na; CN
王文君 WANG, Wenjun; CN
陈昭男 CHEN, Zhaonan; CN
Agent:
深圳市恒申知识产权事务所(普通合伙) HENSEN INTELLECTUAL PROPERTY FIRM; 中国广东省深圳市 福田区南园路68号上步大厦10H 10H Shangbu Building No. 68 Nanyuan Road Futian Shenzhen, Guangdong 518000, CN
Priority Data:
Title (EN) SIMILAR USER SELECTING METHOD AND DEVICE
(FR) PROCÉDÉ ET DISPOSITIF DE SÉLECTION D'UTILISATEURS SIMILAIRES
(ZH) 一种相似用户选取方法及装置
Abstract:
(EN) The present invention relates to the technical field of data analysis and processing, and provided thereby are a similar user selecting method and device. The method comprises: acquiring historical content viewing data of all users (S101); sequencing all historical contents of the users according to a sequential order of viewing time points to acquire a historical viewing content sequence of the users (S102); performing continuous bag-of-words model training on the historical viewing content sequence of the users to acquire a continuous bag-of-words model and a content vector of the historical contents (S103); calculating interest preferences of the users according to the acquired content vector, and calculating similarity between each user and a target user according to the interest preferences of the users (S104); and selecting a preset number of users having the highest similarity to the target user as similar users of the target user (S105). With the described solution, similar users among the users do not need to be calculated according to positive feedback behaviors generated for same articles by the users, and the problem of not being able to carry out similar user calculations due to many users not generating positive feedback behaviors for the same articles may be avoided.
(FR) La présente invention se rapporte au domaine technique de l'analyse et du traitement de données, et concerne un procédé et un dispositif de sélection d'utilisateurs similaires. Le procédé comporte les étapes consistant à: acquérir des données historiques de visualisation de contenu de tous les utilisateurs (S101); séquencer tous les contenus historiques des utilisateurs selon un ordre séquentiel d'instants de visualisation pour acquérir une séquence historique de contenu de visualisation des utilisateurs (S102); effectuer un apprentissage de modèle continu en sac de mots sur la séquence historique de contenu de visualisation des utilisateurs pour acquérir un modèle continu en sac de mots et un vecteur de contenu des contenus historiques (S103); calculer des préférences d'intérêt des utilisateurs d'après le vecteur de contenu acquis, et calculer une similarité entre chaque utilisateur et un utilisateur cible d'après les préférences d'intérêt des utilisateurs (S104); et sélectionner un nombre prédéfini d'utilisateurs présentant la plus forte similarité avec l'utilisateur cible en tant qu'utilisateurs similaires de l'utilisateur cible (S105). Avec la solution décrite, il n'est pas nécessaire de calculer des utilisateurs similaires parmi les utilisateurs en fonction de comportement de réaction positive générés pour les mêmes articles par les utilisateurs, et le problème de l'impossibilité de réaliser des calculs d'utilisateurs similaires en raison du fait que de nombreux utilisateurs ne génèrent pas des comportement de réaction positive pour les mêmes articles peut être évité.
(ZH) 一种相似用户选取方法及装置,涉及数据分析与处理技术领域。该方法包括:获取全部用户的内容查看历史数据(S101),按照查看时间点的先后顺序对用户的全部历史内容进行排序,得到用户的历史查看内容序列(S102),对用户的历史查看内容序列进行连续词袋模型训练,得到连续词袋模型,以及历史内容的内容向量(S103),根据得到的内容向量计算用户的兴趣偏好,并根据用户的兴趣偏好计算各用户与目标用户的相似度(S104),选取与目标用户相似度最高的预置数量个用户作为目标用户的相似用户(S105)。该方案不需要根据用户对同样物品产生正反馈行为来计算用户之间的相似用户,避免了很多没有对同样物品产生过正反馈行为的用户,无法进行相似用户计算的问题。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)