Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020108430 - PROCÉDÉ ET SYSTÈME D'ANALYSE DE SENTIMENT WEIBO

Numéro de publication WO/2020/108430
Date de publication 04.06.2020
N° de la demande internationale PCT/CN2019/120584
Date du dépôt international 25.11.2019
CIB
G06F 16/9535 2019.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
16Recherche d’informations; Structures de bases de données à cet effet; Structures de systèmes de fichiers à cet effet
90Détails des fonctions des bases de données indépendantes des types de données cherchés
95Recherche dans le Web
953Requêtes, p.ex. en utilisant des moteurs de recherche du Web
9535Adaptation de la recherche basée sur les profils des utilisateurs et la personnalisation
G06F 16/33 2019.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
16Recherche d’informations; Structures de bases de données à cet effet; Structures de systèmes de fichiers à cet effet
30de données textuelles non structurées
33Requêtes
CPC
G06F 16/33
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
G06F 16/35
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
G06F 16/9535
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
95Retrieval from the web
953Querying, e.g. by the use of web search engines
9535Search customisation based on user profiles and personalisation
Déposants
  • 南京航空航天大学 NANJING UNIVERSITY OF AERONAUTICS AND ASTRONAUTICS [CN]/[CN]
Inventeurs
  • 李博涵 LI, Bohan
  • 万朔 WAN, Shuo
  • 王凯 WANG, Kai
  • 张安曼 ZHANG, Anman
  • 关东海 GUAN, Donghai
  • 秦小麟 QIN, Xiaolin
Mandataires
  • 北京高沃律师事务所 BEIJING GAOWO LAW FIRM
Données relatives à la priorité
201811432829.328.11.2018CN
Langue de publication chinois (ZH)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) WEIBO SENTIMENT ANALYSIS METHOD AND SYSTEM
(FR) PROCÉDÉ ET SYSTÈME D'ANALYSE DE SENTIMENT WEIBO
(ZH) 一种微博情感分析方法及系统
Abrégé
(EN)
Disclosed in the present invention are a Weibo sentiment analysis method and system. According to the Weibo sentiment analysis method and system provided in the present invention, a certain amount of Weibo text data for a target topic within a preset time period is collected using a focused web crawler, as target topic data, and each target topic data is input into a Weibo sentiment classifier to obtain a sentiment type of each target topic data. In the present invention, an expression word and sentiment word-based weakly supervised learning method is used for sentimental Weibo filtering; a million-scale Chinese Weibo corpus is constructed by selecting positive Weibo data and negative Weibo data which have the same amount; the use of the Weibo sentiment classifier obtained by training a FastText classifier with the corpus can achieve both accuracy and timeliness of classification, thereby accurately reflecting the sentimental trend of a topic.
(FR)
La présente invention concerne un procédé et système d'analyse de sentiment Weibo. Selon le procédé et le système d'analyse de sentiment Weibo décrits dans la présente invention, une certaine quantité de données de texte Weibo pour un sujet cible au cours d'une période prédéfinie est recueillie à l'aide d'un collecteur web focalisé, en tant que données de sujet cible, et chaque donnée de sujet cible est introduite dans un classificateur de sentiment Weibo pour obtenir un type de sentiment de chaque donnée de sujet cible. Dans la présente invention, un procédé d'apprentissage faiblement supervisé basé sur des mots d'expression et des mots de sentiment est utilisé pour un filtrage Weibo par sentiments; un corpus Weibo chinois à l'échelle du million est construit en sélectionnant des données Weibo positives et des données Weibo négatives qui présentent la même quantité; l'utilisation du classificateur de sentiment Weibo obtenu en entraînant un classificateur FastText avec le corpus peut se traduire à la fois par l'exactitude et l'opportunité de la classification, reflétant ainsi de manière exacte la tendance de sentiment d'un sujet.
(ZH)
本发明公开一种微博情感分析方法及系统。本发明提供的微博情感分析方法及系统,采用聚焦网络爬虫采集目标话题在预设时间段内的若干微博文本数据作为目标话题数据,将各个目标话题数据输入微博情感分类器,即可获得各个目标话题数据的情感类型。本发明采用基于表情词和情感词的弱监督学习方法进行情感微博的过滤,选取数量相等的积极微博数据和消极微博数据构建了一个百万量级的中文微博语料库,利用语料库对fastText分类器进行训练获得的微博情感分类器,可兼顾分类的准确性和时效性,能够准确反映话题的情感走向。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international