Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020091618 - SYSTEM FOR IDENTIFYING NAMED ENTITIES WITH DYNAMIC PARAMETERS

Publication Number WO/2020/091618
Publication Date 07.05.2020
International Application No. PCT/RU2018/000712
International Filing Date 30.10.2018
IPC
G06F 17/27 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
20Handling natural language data
27Automatic analysis, e.g. parsing, orthograph correction
Applicants
  • ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "МОСКОВСКИЙ ФИЗИКО-ТЕХНИЧЕСКИЙ ИНСТИТУТ (ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ)" FEDERALNOE GOSUDARSTVENNOE AVTONOMNOE OBRAZOVATELNOE UCHREZHDENIE VYSSHEGO OBRAZOVANIYA "MOSKOVSKY FIZIKO-TEKHNICHESKY INSTITUT (GOSUDARSTVENNY UNIVERSITET)" [RU]/[RU]
Inventors
  • СУВОРОВ, Владимир Александрович SUVOROV, Vladimir Alexandrovich
Agents
  • КОТЛОВ, Дмитрий Владимирович KOTLOV, Dmitry Vladimirovich
Priority Data
Publication Language Russian (RU)
Filing Language Russian (RU)
Designated States
Title
(EN) SYSTEM FOR IDENTIFYING NAMED ENTITIES WITH DYNAMIC PARAMETERS
(FR) SYSTÈME DE DÉTERMINATION D’ENTITÉS NOMMÉES AVEC DES PARAMÈTRES DYNAMIQUES
(RU) СИСТЕМА ОПРЕДЕЛЕНИЯ ИМЕНОВАННЫХ СУЩНОСТЕЙ С ДИНАМИЧЕСКИМИ ПАРАМЕТРАМИ
Abstract
(EN)
The invention relates to the use of computing systems to extract information from texts in a natural language. The technical result consists in increasing the accuracy of automatic identification of named entities from a text. The claimed system for identifying named entities with dynamic parameters comprises a module for processing original texts in a natural language, a module for determining subject areas of named entities, a decision model module and a module with a set of models for extracting named entities from the text, wherein a text in a natural language is received, said text comprising unlabelled sets of sentences or labelled sets of sentences containing defined types of entities, the obtained text is analysed so as to find parts of the text that contain named entities, the named entities are classified, it is determined which particular model for extracting named entities from among the set of models will identify named entities from the text, and the model selected from the set is launched.
(FR)
L'invention concerne l’extraction d’informations à partir de textes en langage naturel au moyen de systèmes informatiques. Le résultat technique consiste à augmenter la précision de détermination automatique d'entités nommées provenant du texte. Le système de l’invention de détermination d’entités nommées avec des paramètres dynamiques comprend un module de traitement de textes d’origine en langage naturel, un module de détermination des thématiques des entités nommées, un module de modèle décisionnel et un module de sélection de modèles d’extraction d’entités nommées dans un texte, le texte étant acceptés dans un langage naturel comprenant des ensemble non marqués de phrases ou des ensembles marqués de phrases contant des entités de types désirés, on analyse le texte reçu pour trouver des segments de texte comprenant des entités nommées, on classifie les entités nommées, on détermine quel modèle d’extraction d'entités nommées dans un ensemble de modèles sera déterminant dans le texte pour les entités nommées et on lance le modèle sélectionné dans l’ensemble.
(RU)
Изобретение относится к извлечению информации из текстов на естественном языке с помощью вычислительных систем. Технический результат заключается в повышении точности автоматического определения именованных сущностей из текста. Заявленная система определения именованных сущностей с динамическими параметрами содержит модуль процессинга исходных текстов на естественном языке, модуль определения тематик именованных сущностей, модуль решающей модели и модуль набора моделей извлечения именованных сущностей из текста, при этом принимают текст на естественном языке, содержащий неразмеченные наборы предложений или размеченные наборы предложений, содержащие сущности определенного типа, анализируют полученный текст для нахождения участков текста, содержащих именованные сущности, классифицируют именованные сущности, определяют какая именно модель извлечения именованных сущностей из набора моделей будет определять из текста именованные сущности, запускают выбранную из набора модель.
Latest bibliographic data on file with the International Bureau