WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2016082575) INFORMATION MINING METHOD AND APPARATUS, AND STORAGE MEDIUM
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2016/082575    International Application No.:    PCT/CN2015/086095
Publication Date: 02.06.2016 International Filing Date: 05.08.2015
IPC:
G06F 17/30 (2006.01)
Applicants: BAIDU ONLINE NETWORK TECHNOLOGY (BEIJING) CO., LTD. [CN/CN]; 3/F Baidu Campus No. 10, Shangdi 10th Street Haidian District, Beijing 100085 (CN)
Inventors: LIU, Song; (CN).
SUN, Kai; (CN).
TAO, Mingyuan; (CN)
Agent: BEYOND ATTORNEYS AT LAW; F6, Xijin Centre 39 Lianhuachi East Rd., Haidian District Beijing 100036 (CN)
Priority Data:
201410710424.7 27.11.2014 CN
Title (EN) INFORMATION MINING METHOD AND APPARATUS, AND STORAGE MEDIUM
(FR) PROCÉDÉ ET APPAREIL D'EXTRACTION D'INFORMATIONS, ET SUPPORT D'INFORMATIONS
(ZH) 信息挖掘方法、装置和存储介质
Abstract: front page image
(EN)Provided are an information mining method and apparatus, and a storage medium. The method includes: monitoring a message issued in an instant communication software application (110); parsing the monitored message to obtain message content (120); matching the message content with a keyword in a pre-established feature identification dictionary (130); and when the matching succeeds, capturing the message content or the message content and related content of the message content as feature description information, and saving the feature description information (140). The message issued in the instant communication software application has high category definition and high information specialism, such that the feature description information of a specific object can be automatically captured by matching the parsed message content with the keyword in the feature identification dictionary and capturing the successfully matched message content or capturing the successfully matched message content and the related content of the message content, thereby reducing the labour costs, and improving the specialism and accuracy of the obtained feature description information of the specific object.
(FR)L'invention concerne un procédé et un appareil d'extraction d'informations, ainsi qu'un support d'informations. Le procédé comprend les étapes consistant : à surveiller un message émis dans une application logicielle de communication instantanée (110); à analyser le message surveillé pour obtenir un contenu de message (120); à mettre en correspondance le contenu de message avec un mot-clé dans un dictionnaire d'identification de caractéristiques pré-établi (130); et lorsque la mise en correspondance réussit, à capturer le contenu du message ou le contenu du message et le contenu associé du contenu de message en tant qu'informations de description de caractéristique, et à sauvegarder des informations de description de caractéristiques (140). Le message émis dans l'application logicielle de communication instantanée a une haute définition de catégories et une haute spécialisation d'informations, de telle sorte que les informations de description de caractéristiques d'un objet spécifique peuvent être automatiquement saisies par mise en correspondance du contenu de message analysé avec le mot-clé dans le dictionnaire d'identification de caractéristiques et capturer le contenu de message mis en correspondance avec succès ou à saisir le contenu de message mis en correspondance avec succès et le contenu associé du contenu du message, ce qui permet de réduire les coûts de main d'œuvre, et d'améliorer la spécialisation et la précision des informations de description de caractéristiques obtenues de l'objet spécifique.
(ZH)提供一种信息挖掘方法、装置和存储介质。该方法包括:监听即时通信软件应用中发布的消息(110);对监听到的消息进行解析,得到消息内容(120);将消息内容与预先建立的特征识别词典中的关键词进行匹配(130);在匹配成功时,抓取所述消息内容,或者所述消息内容和所述消息内容的相关内容作为特征描述信息,并将所述特征描述信息进行保存(140)。由于即时通信软件应用中发布消息不仅类别清晰度高,且信息专业性高,因此通过将解析到的消息内容与特征识别词典中的关键词进行匹配,并抓取匹配成功的消息内容,或抓取匹配成功的消息内容和该消息内容的相关内容,可自动捕获特定对象的特征描述信息,节省了人力成本,并提升了得到的特定对象的特征描述信息的专业性和准确性。
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)