Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Tuesday 27.07.2021 at 12:00 PM CEST
Settings

Settings

Goto Application

1. WO2020133291 - TEXT ENTITY RECOGNITION METHOD AND APPARATUS, COMPUTER DEVICE, AND STORAGE MEDIUM

Publication Number WO/2020/133291
Publication Date 02.07.2020
International Application No. PCT/CN2018/125107
International Filing Date 28.12.2018
IPC
G06F 17/27 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
20Handling natural language data
27Automatic analysis, e.g. parsing, orthograph correction
CPC
G06F 40/295
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
279Recognition of textual entities
289Phrasal analysis, e.g. finite state techniques or chunking
295Named entity recognition
Applicants
  • 深圳市优必选科技有限公司 UBTECH ROBOTICS CORP [CN]/[CN]
Inventors
  • 熊友军 XIONG, Youjun
  • 罗沛鹏 LUO, Peipeng
  • 廖洪涛 LIAO, Hongtao
Agents
  • 深圳中细软知识产权代理有限公司 SHENZHEN CIPRUN INTELLECTUAL PROPERTY AGENCY CO., LTD.
Priority Data
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) TEXT ENTITY RECOGNITION METHOD AND APPARATUS, COMPUTER DEVICE, AND STORAGE MEDIUM
(FR) PROCÉDÉ ET APPAREIL DE RECONNAISSANCE D'ENTITÉS DE TEXTE, DISPOSITIF INFORMATIQUE, ET SUPPORT DE STOCKAGE
(ZH) 文本实体识别方法、装置、计算机设备及存储介质
Abstract
(EN)
A text entity recognition method, comprising: obtaining a text of an entity to be recognized (S202); using the text as an input of an entity recognition model to obtain a first predicted entity set output by the entity recognition model (S204); using a word segmentation mechanism to perform word segmentation on the text, and extracting, according to the word segmentation processing result, a second predicted entity set (S206); and determining, according to the first predicted entity set and the second predicted entity set, a target entity set obtained through recognition, the target entity set being a set of target entities (S208). By using the word segmentation mechanism as a supplementary recognition, the accuracy of entity recognition is improved. In addition, also provided are a text entity recognition apparatus, a computer device, and a storage medium.
(FR)
L’invention porte sur un procédé de reconnaissance d'entité de texte, comprenant les étapes consistant à : obtenir un texte d'une entité à reconnaître (S202) ; utiliser le texte en tant qu’entrée d'un modèle de reconnaissance d'entité pour obtenir un premier ensemble d'entités prédites délivré par le modèle de reconnaissance d'entité (S204) ; utiliser un mécanisme de segmentation de mots pour effectuer une segmentation de mots sur le texte, et extraire, en fonction du résultat du traitement de segmentation de mots, d'un second ensemble d'entités prédites (S206) ; et déterminer, en fonction du premier ensemble d'entités prédites et le deuxième ensemble d'entités prédites, un ensemble d'entités cibles obtenu par reconnaissance, l'ensemble d'entités cibles étant un ensemble d'entités cibles (S208). En utilisant le mécanisme de segmentation de mots en tant que reconnaissance supplémentaire, la précision de la reconnaissance d'entités est améliorée. La présente invention porte en outre sur un appareil de reconnaissance d'entités textuelles, un dispositif informatique et un support de stockage.
(ZH)
一种文本实体识别方法,该方法包括:获取待识别实体的文本(S202);将所述文本作为实体识别模型的输入,获取所述实体识别模型输出的第一预测实体集(S204);采用分词机制对所述文本进行分词处理,根据分词处理结果提取出第二预测实体集(S206);根据所述第一预测实体集和所述第二预测实体集确定识别得到的目标实体集,所述目标实体集为目标实体的集合(S208)。通过采用分词机制作为补充识别,提高了实体识别的准确率。此外,还提出了一种文本实体识别装置、计算机设备及存储介质。
Latest bibliographic data on file with the International Bureau