Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Tuesday 27.07.2021 at 12:00 PM CEST
Settings

Settings

Goto Application

1. WO2020132933 - SHORT TEXT FILTERING METHOD AND APPARATUS, MEDIUM AND COMPUTER DEVICE

Publication Number WO/2020/132933
Publication Date 02.07.2020
International Application No. PCT/CN2018/123847
International Filing Date 26.12.2018
IPC
G06F 16/335 2019.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
335Filtering based on additional data, e.g. user or group profiles
CPC
G06F 16/335
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
335Filtering based on additional data, e.g. user or group profiles
G06F 16/35
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
35Clustering; Classification
G06F 40/289
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
279Recognition of textual entities
289Phrasal analysis, e.g. finite state techniques or chunking
Applicants
  • 深圳市优必选科技有限公司 UBTECH ROBOTICS CORP [CN]/[CN]
Inventors
  • 熊友军 XIONG, Youjun
  • 罗沛鹏 LUO, Peipeng
  • 廖洪涛 LIAO, Hongtao
Agents
  • 深圳中细软知识产权代理有限公司 SHENZHEN CIPRUN INTELLECTUAL PROPERTY AGENCY CO., LTD.
Priority Data
201811594130.725.12.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) SHORT TEXT FILTERING METHOD AND APPARATUS, MEDIUM AND COMPUTER DEVICE
(FR) PROCÉDÉ ET APPAREIL DE FILTRAGE DE TEXTE COURT, SUPPORT ET DISPOSITIF INFORMATIQUE
(ZH) 短文本过滤方法、装置、介质及计算机设备
Abstract
(EN)
A short text filtering method and apparatus, a medium and a computer device. The method comprises: acquiring a text to be detected, wherein the text to be detected is a short text (S102); performing word segmentation on the text to be detected, so as to acquire a word segmentation result including at least one word vector (S104); and calculating the relevancy between the word segmentation result and a pre-set corpus database, and filtering the text to be detected according to the relevancy (S106). By means of the short text filtering method and apparatus, the medium and the computer device, the accuracy of short text filtering can be improved.
(FR)
L'invention concerne un procédé et un appareil de filtrage de texte court, un support et un dispositif informatique. Le procédé consiste à : obtenir un texte à détecter, le texte à détecter étant un texte court (S102) ; effectuer une segmentation de mot sur le texte à détecter, de façon à obtenir un résultat de segmentation de mot comprenant au moins un vecteur de mot (S104) ; et calculer la pertinence entre le résultat de segmentation de mot et une base de données de corpus prédéfini, et filtrer le texte à détecter en fonction de la pertinence (S106). Au moyen du procédé et de l'appareil de filtrage de texte court, du support et du dispositif informatique, la précision du filtrage de texte court peut être améliorée.
(ZH)
一种短文本过滤方法、装置、介质和计算机设备,包括:获取待检测文本,所述待检测文本为短文本(S102);对所述待检测文本进行分词,获取包含至少一个词向量的分词结果(S104);计算所述分词结果与预设的语料数据库的相关度,根据所述相关度对所述待检测文本进行过滤(S106)。采用上述短文本过滤方法、装置、介质和计算机设备,可以提高短文本过滤的准确率。
Also published as
Latest bibliographic data on file with the International Bureau