Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020108430 - WEIBO SENTIMENT ANALYSIS METHOD AND SYSTEM

Publication Number WO/2020/108430
Publication Date 04.06.2020
International Application No. PCT/CN2019/120584
International Filing Date 25.11.2019
IPC
G06F 16/9535 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
95Retrieval from the web
953Querying, e.g. by the use of web search engines
9535Search customisation based on user profiles and personalisation
G06F 16/33 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
CPC
G06F 16/33
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
G06F 16/35
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
G06F 16/9535
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
95Retrieval from the web
953Querying, e.g. by the use of web search engines
9535Search customisation based on user profiles and personalisation
Applicants
  • 南京航空航天大学 NANJING UNIVERSITY OF AERONAUTICS AND ASTRONAUTICS [CN]/[CN]
Inventors
  • 李博涵 LI, Bohan
  • 万朔 WAN, Shuo
  • 王凯 WANG, Kai
  • 张安曼 ZHANG, Anman
  • 关东海 GUAN, Donghai
  • 秦小麟 QIN, Xiaolin
Agents
  • 北京高沃律师事务所 BEIJING GAOWO LAW FIRM
Priority Data
201811432829.328.11.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) WEIBO SENTIMENT ANALYSIS METHOD AND SYSTEM
(FR) PROCÉDÉ ET SYSTÈME D'ANALYSE DE SENTIMENT WEIBO
(ZH) 一种微博情感分析方法及系统
Abstract
(EN)
Disclosed in the present invention are a Weibo sentiment analysis method and system. According to the Weibo sentiment analysis method and system provided in the present invention, a certain amount of Weibo text data for a target topic within a preset time period is collected using a focused web crawler, as target topic data, and each target topic data is input into a Weibo sentiment classifier to obtain a sentiment type of each target topic data. In the present invention, an expression word and sentiment word-based weakly supervised learning method is used for sentimental Weibo filtering; a million-scale Chinese Weibo corpus is constructed by selecting positive Weibo data and negative Weibo data which have the same amount; the use of the Weibo sentiment classifier obtained by training a FastText classifier with the corpus can achieve both accuracy and timeliness of classification, thereby accurately reflecting the sentimental trend of a topic.
(FR)
La présente invention concerne un procédé et système d'analyse de sentiment Weibo. Selon le procédé et le système d'analyse de sentiment Weibo décrits dans la présente invention, une certaine quantité de données de texte Weibo pour un sujet cible au cours d'une période prédéfinie est recueillie à l'aide d'un collecteur web focalisé, en tant que données de sujet cible, et chaque donnée de sujet cible est introduite dans un classificateur de sentiment Weibo pour obtenir un type de sentiment de chaque donnée de sujet cible. Dans la présente invention, un procédé d'apprentissage faiblement supervisé basé sur des mots d'expression et des mots de sentiment est utilisé pour un filtrage Weibo par sentiments; un corpus Weibo chinois à l'échelle du million est construit en sélectionnant des données Weibo positives et des données Weibo négatives qui présentent la même quantité; l'utilisation du classificateur de sentiment Weibo obtenu en entraînant un classificateur FastText avec le corpus peut se traduire à la fois par l'exactitude et l'opportunité de la classification, reflétant ainsi de manière exacte la tendance de sentiment d'un sujet.
(ZH)
本发明公开一种微博情感分析方法及系统。本发明提供的微博情感分析方法及系统,采用聚焦网络爬虫采集目标话题在预设时间段内的若干微博文本数据作为目标话题数据,将各个目标话题数据输入微博情感分类器,即可获得各个目标话题数据的情感类型。本发明采用基于表情词和情感词的弱监督学习方法进行情感微博的过滤,选取数量相等的积极微博数据和消极微博数据构建了一个百万量级的中文微博语料库,利用语料库对fastText分类器进行训练获得的微博情感分类器,可兼顾分类的准确性和时效性,能够准确反映话题的情感走向。
Also published as
Latest bibliographic data on file with the International Bureau