Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2018142266) INFORMATION EXTRACTION FROM DOCUMENTS
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2018/142266 International Application No.: PCT/IB2018/050533
Publication Date: 09.08.2018 International Filing Date: 29.01.2018
IPC:
G06F 17/00 (2006.01) ,G06F 15/18 (2006.01) ,G06F 17/20 (2006.01)
[IPC code unknown for G06F 17][IPC code unknown for G06F 15/18][IPC code unknown for G06F 17/20]
Applicants:
MOCSY INC. [CA/CA]; 2110-361 Front Street West Toronto, Ontario M5V 3R5, CA
Inventors:
LI, Jasper; CA
Agent:
PERRY + CURRIER INC.; 1300 Yonge Street Suite 500 Toronto, Ontario M4T 1X3, CA
Priority Data:
62/452,73631.01.2017US
Title (EN) INFORMATION EXTRACTION FROM DOCUMENTS
(FR) EXTRACTION D'INFORMATIONS À PARTIR DE DOCUMENTS
Abstract:
(EN) There is provided a method including sending a first document to a GUI, and receiving at a classification and extraction engine (CEE) from the GUI an input indicating first document data for the first document. The input forms a portion of a dataset. A prediction is generated at the CEE of second document data for a second document using a machine learning model (MLM) configured to receive an input and generate a predicted output. The MLM is trained using the dataset, the input includes one or more tokens corresponding to the second document. The output includes the prediction of the second document data. The prediction is sent to the GUI, and feedback on the prediction is received at the CEE from the GUI, to form a reviewed prediction. The reviewed prediction is added to the dataset to form an enlarged dataset, and the MLM is trained using the enlarged dataset.
(FR) L'invention concerne un procédé comprenant l'envoi d'un premier document à une GUI, et la réception par un moteur de classification et d'extraction (CEE) d'une entrée provenant de la GUI et indiquant des premières données de document pour le premier document. L'entrée fait partie d'un ensemble de données. Une prédiction est générée par le CEE quant à des secondes données de document pour un second document au moyen d'un modèle d'apprentissage automatique (MLM) configuré pour recevoir une entrée et générer une sortie prédite. Le MLM est entraîné à l'aide de l'ensemble de données, et l'entrée comporte un ou plusieurs jetons correspondant au second document. La sortie inclut la prédiction des secondes données de document. La prédiction est envoyée à la GUI, et un retour sur la prédiction provenant de la GUI est reçu par le CEE pour créer une prédiction révisée. La prédiction révisée est ajoutée à l'ensemble de données pour obtenir un ensemble de données agrandi, et le MLM est entraîné à l'aide de l'ensemble de données agrandi.
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)