Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020091863 - SYSTEMS AND METHODS FOR IDENTIFYING DOCUMENTS WITH TOPIC VECTORS

Publication Number WO/2020/091863
Publication Date 07.05.2020
International Application No. PCT/US2019/043703
International Filing Date 26.07.2019
IPC
G06F 17/27 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
17Digital computing or data processing equipment or methods, specially adapted for specific functions
20Handling natural language data
27Automatic analysis, e.g. parsing, orthograph correction
G06F 16/36 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
36Creation of semantic tools, e.g. ontology or thesauri
G06N 20/00 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
20Machine learning
CPC
G06F 16/94
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
93Document management systems
94Hyperlinking G06F40/134
G06N 20/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
20Machine learning
Applicants
  • INTUIT INC. [US]/[US]
Inventors
  • HO, Nhung
  • CHEN, Meng
  • SIMPSON, Heather
  • MENG, Xiangling
Agents
  • LORD, Robert, P.
  • VICERE, Annemarie, L.
  • KING, Benjamin
  • FAY, Theodore
Priority Data
16/175,52530.10.2018US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) SYSTEMS AND METHODS FOR IDENTIFYING DOCUMENTS WITH TOPIC VECTORS
(FR) SYSTÈMES ET PROCÉDÉS D'IDENTIFICATION DE DOCUMENTS AVEC DES VECTEURS DE SUJET
Abstract
(EN)
One or more embodiments are directed to identifying documents with topic vectors by training a machine learning model with a training documents generated from text collections, receiving, after generating a list of topic vectors for the plurality of text collections, an additional text collection, and generating an additional topic vector for the additional text collection without training the machine learning model on the additional text collection. One or more embodiments further include updating the list of topic vectors with additional topic vectors that includes the additional topic vector, receiving a first topic vector based on a first text collection generated in response to user interaction, and matching the first topic vector to the additional topic vector. One or more embodiments further include presenting a link corresponding to the additional text collection in response to matching the first topic vector to the additional topic vector.
(FR)
Un ou plusieurs modes de réalisation de l'invention concernent l'identification de documents à l'aide de vecteurs de sujet par entraînement d'un modèle d'apprentissage automatique avec un document d'entraînement créé à partir de recueils de textes, la réception, après la création d'une liste de vecteurs de sujet pour la pluralité de recueils de textes, d'un recueil de textes supplémentaire, et la création d'un vecteur de sujet supplémentaire pour le recueil de textes supplémentaire sans entraîner le modèle d'apprentissage automatique sur le recueil de textes supplémentaire. Un ou plusieurs modes de réalisation comprennent en outre la mise à jour de la liste de vecteurs de sujet avec des vecteurs de sujet supplémentaires qui comprend le vecteur de sujet supplémentaire, la réception d'un premier vecteur de sujet sur la base d'un premier recueil de textes créé en réponse à une interaction d'utilisateur, et la mise en correspondance du premier vecteur de sujet avec le vecteur de sujet supplémentaire. Un ou plusieurs modes de réalisation comprennent en outre la présentation d'un lien correspondant au recueil de textes supplémentaire en réponse à la mise en correspondance du premier vecteur de sujet avec le vecteur de sujet supplémentaire.
Also published as
Latest bibliographic data on file with the International Bureau