Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020139592 - ENTITY EXTRACTION RULES HARVESTING AND PERFORMANCE

Publication Number WO/2020/139592
Publication Date 02.07.2020
International Application No. PCT/US2019/066432
International Filing Date 16.12.2019
IPC
G06F 16/25 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
25Integrating or interfacing systems involving database management systems
CPC
G06F 16/2455
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
24Querying
245Query processing
2455Query execution
G06F 16/2457
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
24Querying
245Query processing
2457with adaptation to user needs
G06F 16/254
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
25Integrating or interfacing systems involving database management systems
254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
G06F 16/26
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
20of structured data, e.g. relational data
26Visual data mining; Browsing structured data
G06N 20/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
20Machine learning
Applicants
  • MICROSOFT TECHNOLOGY LICENSING, LLC [US]/[US]
Inventors
  • ISRAEL, Moshe
  • GARYANI, Yaakov
  • COHEN, Or
Agents
  • MINHAS, Sandip S.
  • ADJEMIAN, Monica
  • BARKER, Doug
  • CHATTERJEE, Aaron C.
  • CHEN, Wei-Chen Nicholas
  • CHOI, Daniel
  • CHURNA, Timothy
  • DINH, Phong
  • EVANS, Patrick
  • GABRYJELSKI, Henry
  • GOLDSMITH, Micah P.
  • GUPTA, Anand
  • HINOJOSA-SMITH, Brianna L.
  • HWANG, William C.
  • JARDINE, John S.
  • LEE, Sunah
  • LEMMON, Marcus
  • MARQUIS, Thomas
  • MEYERS, Jessica
  • ROPER, Brandon
  • SPELLMAN, Steven
  • SULLIVAN, Kevin
  • SWAIN, Cassandra T.
  • TABOR, Ben
  • WALKER, Matt
  • WIGHT, Stephen A.
  • WISDOM, Gregg
  • WONG, Ellen
  • WONG, Thomas S.
  • ZHANG, Hannah
  • TRAN, Kimberly
Priority Data
16/231,51723.12.2018US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) ENTITY EXTRACTION RULES HARVESTING AND PERFORMANCE
(FR) COLLECTE ET EXÉCUTION DE RÈGLES D'EXTRACTION D'ENTITÉ
Abstract
(EN)
Security Information and Event Management tools, log management tools, log analysis tools, and other event data management tools are enhanced. Enhancements harvest entity extraction rules from queries, query results, and other examples involving the extraction of field values from large amounts of data, and help perform entity extraction efficiently. Entity extraction operations locate IP addresses, usernames, and other field values that are embedded in logs or data streams, for example, and populate object properties with extracted values. Previously used extraction rules are applied in new contexts with different users, different data sources, or both. An entity extraction rules database serves as a model that contains rules specifying parsing mechanisms. Parsing mechanisms may include regular expressions, separation character definitions, and may process particular file formats or object notation formats or markup language formats. A recommender suggests extraction rules to users, based on frequency, machine learning classifications, correctness certainty, or other considerations.
(FR)
L’invention concerne des outils de gestion d'informations de sécurité et d'événements, des outils de gestion de journal, des outils d'analyse de journal et d'autres outils de gestion de données d'événement qui sont améliorés. Les améliorations sont apportées à des règles d'extraction d'entité de collecte à partir de requêtes, de résultats de requête, et d'autres exemples impliquant l'extraction de valeurs de champ à partir de grandes quantités de données, et aident à effectuer une extraction d'entité efficacement. Des opérations d'extraction d'entité localisent des adresses IP, des noms d'utilisateurs et d'autres valeurs de champ qui sont intégrées dans des journaux ou des flux de données, par exemple, et alimentent des propriétés d'objet avec des valeurs extraites. Des règles d'extraction précédemment utilisées sont appliquées dans de nouveaux contextes avec différents utilisateurs et/ou différentes sources de données. Une base de données de règles d'extraction d'entité sert de modèle qui contient des règles spécifiant des mécanismes d'analyse. Les mécanismes d'analyse peuvent comprendre des expressions régulières, des définitions de caractères de séparation et peuvent traiter des formats de fichiers particuliers ou des formats de notation d'objets ou des formats de langage de balisage. Un dispositif de recommandation suggère des règles d'extraction à des utilisateurs, sur la base de classifications d'apprentissage automatique, de fréquence, de certitude d'exactitude ou d'autres considérations.
Also published as
Latest bibliographic data on file with the International Bureau