WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2017190641) CRAWLER INTERCEPTION METHOD AND DEVICE, SERVER TERMINAL AND COMPUTER READABLE MEDIUM
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.:    WO/2017/190641    International Application No.:    PCT/CN2017/082707
Publication Date: 09.11.2017 International Filing Date: 02.05.2017
IPC:
G06F 17/30 (2006.01)
Applicants: BEIJING JINGDONG SHANGKE INFORMATION TECHNOLOGY CO., LTD. [CN/CN]; Western 1-4th Floors & Eastern 1-4th Floors of Building No. 11, Fourth District of West Cedar Creative Park, Xingshikou Road No.65 Haidian District Beijing 100195 (CN)
Inventors: WANG, Xiangwei; (CN).
HAN, Xiaoyue; (CN).
WANG, Fei; (CN).
XIE, Gang; (CN).
FEI, Yanru; (CN).
HAN, Yong; (CN).
MA, Shunfeng; (CN)
Agent: CHINA SINDA INTELLECTUAL PROPERTY LTD.; B11th Floor, Focus Place, 19 Financial Street Xicheng District Beijing 100033 (CN)
Priority Data:
201610286222.3 03.05.2016 CN
Title (EN) CRAWLER INTERCEPTION METHOD AND DEVICE, SERVER TERMINAL AND COMPUTER READABLE MEDIUM
(FR) PROCÉDÉ ET DISPOSITIF D'INTERCEPTION DE ROBOT, TERMINAL DE SERVEUR ET SUPPORT LISIBLE PAR ORDINATEUR
(ZH) 拦截爬虫的方法、装置、服务器终端以及计算机可读介质
Abstract: front page image
(EN)Proposed are a crawler interception method and device, a server and a medium. The method comprises: after receiving an access request, sent by a client, for accessing a page, a server end generating a current field value for recognizing a crawler and generating a picture attribute value for saving the field value in a picture; saving a picture uniform resource locator (URL) path that contains the picture attribute value in the requested page; the server end determining whether a current page to be accessed belongs to a direct access allowed page; if so, returning the requested page to the client; if not, further determining whether the access request contains a valid field value for recognizing the crawler; if there is a valid field value, returning the requested page to the client; and if no field value is contained for recognizing the crawler, or a contained field value is invalid, confirming that same is the crawler, and returning a first classified page of the page to be accessed to the client. By means of the present invention, crawler access can be effectively intercepted.
(FR)La présente invention concerne un procédé et un dispositif d'interception de robot, un serveur et un support de stockage. Le procédé consiste : après réception d'une demande d'accès, envoyée par un client, pour accéder à une page, à générer, par une extrémité de serveur, une valeur de champ courante permettant de reconnaître un robot et de générer une valeur d'attribut d'image afin de sauvegarder la valeur de champ dans une image; à sauvegarder un chemin d'accès à un localisateur uniforme de ressources (URL) d'image qui contient la valeur d'attribut d'image dans la page demandée; à déterminer, par l'extrémité de serveur, si une page courante faisant l'objet d'un accès appartient à une page autorisée d'accès direct; si tel est le cas, à renvoyer la page demandée au client; si tel n'est pas le cas, à déterminer en outre si la demande d'accès contient une valeur de champ valide permettant de reconnaître le robot; s'il existe une valeur de champ valide, à renvoyer la page demandée au client; et si la demande d'accès ne contient aucune valeur de champ permettant de reconnaître le robot, ou que la valeur de champ contenue dans la demande d'accès n'est pas valide, à confirmer que ladite valeur de champ est le robot, et à renvoyer une première page classifiée de la page faisant l'objet d'un accès au client. Grâce à la présente invention, l'accès d'un robot peut être intercepté efficacement.
(ZH)本发明提出一种拦截爬虫的方法、装置、服务器及介质,该方法包括:服务器端接收到客户端发送的访问页面的访问请求后,生成当前用于识别爬虫的字段值,并生成将所述字段值保存到图片中的图片属性值;将包含有所述图片属性值的图片统一资源定位符URL路径保存到所请求的页面中;服务器端判断当前要访问页面是否属于直接允许访问页面,如果是,则将所请求的页面返回给客户端;如果否,则进一步判断所述访问请求中是否包含用于识别爬虫的有效字段值,如果是有效字段值,则将所请求的页面返回给客户端;如果不包含用于识别爬虫的字段值,或者所包含的字段值无效,则确认为爬虫,将要访问页面的分类第一页返回给客户端。采用本发明能够有效拦截爬虫访问。
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)