WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2017198022) LUCENCE CUSTOM THESAURUS-BASED FULL TEXT RETRIEVAL MATCHING METHOD AND SYSTEM
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2017/198022 International Application No.: PCT/CN2017/080784
Publication Date: 23.11.2017 International Filing Date: 17.04.2017
IPC:
G06F 17/30 (2006.01)
Applicants: WUHAN DOUYU NETWORK TECHNOLOGY CO., LTD.[CN/CN]; 11/F, No. B1, 4.1 Phase Of The Software Industry Software Park East Road No. 1 Wuhandonghu Development District Wuhan, Hubei 430000, CN
Inventors: BAI, Fan; CN
Agent: WUHAN ZHI QUAN PATENT AGENCY; Room 2103, 21th Floor, Building No.4, Xingguangwuxian No.727 Luoyu Road,Donghu New Technology District. Wuhan, Hubei 430000, CN
Priority Data:
201610321306.616.05.2016CN
Title (EN) LUCENCE CUSTOM THESAURUS-BASED FULL TEXT RETRIEVAL MATCHING METHOD AND SYSTEM
(FR) PROCÉDÉ ET SYSTÈME DE MISE EN CORRESPONDANCE DE RÉCUPÉRATION DE TEXTE COMPLET BASÉ SUR UN THÉSAURUS PERSONNALISÉ DE TYPE LUCENE
(ZH) 基于Lucence自定义词库的全文检索匹配方法及系统
Abstract: front page image
(EN) The present invention relates to the field of big data search. A Lucene custom thesaurus-based full text retrieval matching method and system. The method comprises the following steps: obtaining a search word inputted by a user in a real-time manner in a Lucene search environment, detecting whether a result is found; if a result is not found, removing a special character from the search word, and storing the word in a Lucene custom thesaurus; if a result is found, segmenting the search word, continuing to search the several segmented word groups, and detecting whether a result is found; then if a result is not found, removing a special character from the word group for which a result cannot be found, and storing the word group in the Lucene custom thesaurus; if a result is found, recording a search time, segmented search words and search feedback information, and ultimately establishing a Lucene custom thesaurus supporting Lucene full text retrieval. The method is based on the search words inputted by a user, so that a dedicated Lucene custom thesaurus can be established quickly and effectively.
(FR) La présente invention concerne le domaine de la recherche de données massives. L'invention concerne un procédé et un système de mise en correspondance de récupération de texte complet basé sur un thésaurus personnalisé de type Lucene. Le procédé comporte les étapes suivantes consistant à : obtenir un mot de recherche entré par un utilisateur en temps réel dans un environnement de recherche de type Lucene, détecter si un résultat est trouvé; si un résultat n'est pas trouvé, supprimer un caractère spécial du mot de recherche, et stocker le mot dans un thésaurus personnalisé de type Lucene; si un résultat est trouvé, segmenter le mot de recherche, continuer la recherche des multiples groupes de mots segmentés, et détecter si un résultat est trouvé; puis si un résultat n'est pas trouvé, supprimer un caractère spécial du groupe de mots pour lequel un résultat ne peut pas être trouvé, stocker le groupe de mots dans le thésaurus personnalisé de type Lucene; si un résultat est trouvé, enregistrer un temps de recherche, les mots de recherche segmentés et des informations de retour de recherche, et finir par établir un thésaurus personnalisé de type Lucene permettant la prise en charge d'une récupération de texte complet de type Lucene. Le procédé est basé sur les mots de recherche entrés par un utilisateur, de telle sorte qu'un thésaurus personnalisé spécialisé de type Lucene peut être établi de manière rapide et efficace.
(ZH) 一种基于Lucene自定义词库的全文检索匹配方法及系统,涉及大数据搜索领域。该方法包括以下步骤:在Lucene搜索环境中,实时获取用户输入的搜索词,检测是否搜索到结果,搜索不到,则将搜索词去掉特殊字符,存入Lucene自定义词库;搜索到,则对搜索词进行分词,对分词后的若干词组继续进行搜索,检测是否搜索到结果,搜索不到,则将搜索不到结果的分词后的词组去掉特殊字符,存入Lucene自定义词库;搜索到,则记录搜索的时间、分词后的搜索词、搜索反馈信息,最终建立支持Lucene全文检索的Lucene自定义词库。该方法根据用户输入的搜索词,能够快速有效地建立自己专用的Lucene自定义词库。
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)