Processing

Please wait...

Settings

Settings

Goto Application

1. WO2022048210 - NAMED ENTITY RECOGNITION METHOD AND APPARATUS, AND ELECTRONIC DEVICE AND READABLE STORAGE MEDIUM

Publication Number WO/2022/048210
Publication Date 10.03.2022
International Application No. PCT/CN2021/097069
International Filing Date 30.05.2021
IPC
G06F 40/295 2020.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
279Recognition of textual entities
289Phrasal analysis, e.g. finite state techniques or chunking
295Named entity recognition
CPC
G06F 40/295
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
40Handling natural language data
20Natural language analysis
279Recognition of textual entities
289Phrasal analysis, e.g. finite state techniques or chunking
295Named entity recognition
Applicants
  • 平安科技(深圳)有限公司 PING AN TECHNOLOGY (SHENZHEN) CO., LTD. [CN]/[CN]
Inventors
  • 刘玉 LIU, Yu
  • 徐国强 XU, Guoqiang
Agents
  • 深圳市沃德知识产权代理事务所(普通合伙) SHENZHEN WORLD INTELLECTUAL PROPERTY AGENCY (GENERAL PARTNERSHIP )
Priority Data
202010920446.103.09.2020CN
Publication Language Chinese (zh)
Filing Language Chinese (ZH)
Designated States
Title
(EN) NAMED ENTITY RECOGNITION METHOD AND APPARATUS, AND ELECTRONIC DEVICE AND READABLE STORAGE MEDIUM
(FR) PROCÉDÉ ET APPAREIL DE RECONNAISSANCE D'ENTITÉS NOMMÉES, DISPOSITIF ÉLECTRONIQUE ET SUPPORT DE STOCKAGE LISIBLE
(ZH) 命名实体识别方法、装置、电子设备及可读存储介质
Abstract
(EN) A named entity recognition method and apparatus, and an electronic device and a readable storage medium, which relate to the technical field of data processing. The method comprises: performing named entity category extraction on a plurality of data sets to obtain sub-data sets corresponding to named entity categories; constructing a named entity recognition model, wherein the named entity recognition model comprises a plurality of output branches, and each output branch corresponds to a named entity category, and inputting the sub-data sets into the named entity recognition model for training, so as to obtain a trained named entity recognition model (S2); acquiring text to be subjected to named entity recognition and a target named entity category that are carried in a request; and inputting said text into the trained named entity recognition model, and taking a recognition result, which is output by an output branch corresponding to the target named entity category, as a target recognition result (S4). By using the method, the acquisition efficiency of named entity data sets can be improved, and the named entity recognition accuracy can be improved.
(FR) L'invention concerne un procédé et un appareil de reconnaissance d'entités nommées, un dispositif électronique et un support de stockage lisible qui relèvent du domaine technique du traitement de données. Le procédé comprend les étapes consistant à : effectuer une extraction de catégories d'entités nommées sur une pluralité d'ensembles de données de façon à obtenir des ensembles de sous-données correspondant aux catégories d'entités nommées; construire un modèle de reconnaissance d'entités nommées, le modèle de reconnaissance d'entités nommées comportant une pluralité de ramifications de sortie et chaque ramification de sortie correspondant à une catégorie d'entités nommées, puis entrer les ensembles de sous-données dans le modèle de reconnaissance d'entités nommées en vue d'une formation de façon à obtenir un modèle de reconnaissance d'entités nommées formé (S2); acquérir un texte devant être soumis à une reconnaissance d'entités nommées et une catégorie d'entités nommées cible qui sont véhiculés dans une demande; et entrer ledit texte dans le modèle de reconnaissance d'entités nommées formé et prendre pour résultat de reconnaissance cible un résultat de reconnaissance sorti par une ramification de sortie correspondant à la catégorie d'entités nommées cible (S4). Le procédé permet d'accroître l'efficacité d'acquisition d'ensembles de données d'entités nommées et la précision de reconnaissance d'entités nommées.
(ZH) 一种命名实体识别方法、装置、电子设备及可读存储介质,涉及数据处理技术领域。上述方法包括:对多个数据集执行命名实体类别提取得到各个命名实体类别对应的子数据集;构建命名实体识别模型,所述命名实体识别模型包括多个输出分支,每个输出分支对应一个命名实体类别,将子数据集输入命名实体识别模型进行训练,得到训练好的命名实体识别模型(S2);获取请求携带的待命名实体识别文本及目标命名实体类别;将待命名实体识别文本输入训练好的命名实体识别模型,将目标命名实体类别对应的输出分支输出的识别结果作为目标识别结果(S4)。上述方法可提升命名实体数据集的获取效率、提高命名实体识别准确度。
Related patent documents
Latest bibliographic data on file with the International Bureau