Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018086518) METHOD AND DEVICE FOR REAL-TIME DETECTION OF NEW SUBJECT
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/086518 International Application No.: PCT/CN2017/109840
Publication Date: 17.05.2018 International Filing Date: 08.11.2017
IPC:
G06F 17/30 (2006.01)
[IPC code unknown for G06F 17/30]
Applicants:
北京国双科技有限公司 BEIJING GRIDSUM TECHNOLOGY CO., LTD. [CN/CN]; 中国北京市 海淀区双榆树小区知春路76号翠宫饭店8层 8/F Jadepalace Hotel 76 Zhi Chun Road, Haidian District Beijing 100086, CN
Inventors:
徐文斌 XU, Wenbin; CN
Agent:
北京鼎佳达知识产权代理事务所(普通合伙) BEIJING DINGJIADA IP FIRM; 中国北京市 朝阳区小黄庄北街2号B座705 B705, No.2, Xiao Huang Zhuang North Street, Chaoyang District Beijing 100101, CN
Priority Data:
201610980540.X08.11.2016CN
Title (EN) METHOD AND DEVICE FOR REAL-TIME DETECTION OF NEW SUBJECT
(FR) PROCÉDÉ ET DISPOSITIF DE DÉTECTION EN TEMPS RÉEL D'UN NOUVEAU SUJET
(ZH) 一种新主题的实时检测方法及装置
Abstract:
(EN) A method and device for real-time detection of a new subject, relating to the technical field of Internet, mainly aim at detecting a subject newly appeared in a text in real time and using the subject as an option to which subsequent text classification belongs so as to improve accuracy of text classification. The method comprises: obtaining a vectorized document according to a designated field in real time (101); calculating a subject of the document according to distribution of subject terms in the document (102); determining whether the subject of the document belongs to an existing subject classification or not (103); and if not, creating a new subject, and allocating the document in the classification of the new subject (104). The method and device are mainly used for online real-time detection of a new subject in a document.
(FR) L'invention concerne un procédé et un dispositif qui permettent de détecter un nouveau sujet en temps réel, se rapportant au domaine technique d'Internet, et qui visent principalement à détecter en temps réel un sujet nouvellement apparu dans un texte ainsi qu’à utiliser le sujet comme une option à laquelle appartient une classification de texte ultérieure en vue d’améliorer la précision de la classification de texte. Le procédé consiste à : obtenir un document vectorisé selon un champ désigné en temps réel (101) ; calculer un sujet du document en fonction de la répartition des termes du sujet dans le document (102) ; déterminer si le sujet du document appartient ou non à une classification de sujet existante (103) ; et si tel n'est pas le cas, créer un nouveau sujet, puis attribuer le document dans la classification du nouveau sujet (104). Le procédé et le dispositif sont principalement utilisés pour détecter en ligne et en temps réel un nouveau sujet dans un document.
(ZH) 一种新主题的实时检测方法及装置,涉及互联网技术领域,主要目的在于实时检测文本中新出现的主题并将该主题作为后续文本分类归属的选项,从而提高对文本分类的准确性。该方法为:根据指定的领域实时获取向量化表示的文档(101);根据所述文档中主题词的分布计算所述文档的主题(102);判断所述文档的主题是否能够归属为已有的主题分类中(103);若不能,则创建新主题,并将所述文档划分在所述新主题的分类中(104)。该方法及装置主要用于在线实时检测文档中的新主题。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)