Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2019006115) SYSTEMS AND METHODS FOR EXTRACTING FUNDER INFORMATION FROM TEXT
Latest bibliographic data on file with the International Bureau    Submit observation

Pub. No.: WO/2019/006115 International Application No.: PCT/US2018/039997
Publication Date: 03.01.2019 International Filing Date: 28.06.2018
IPC:
G06K 9/00 (2006.01) ,G06K 9/46 (2006.01) ,G06N 99/00 (2010.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
K
RECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9
Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
K
RECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9
Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
36
Image preprocessing, i.e. processing the image information without deciding about the identity of the image
46
Extraction of features or characteristics of the image
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
N
COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
99
Subject matter not provided for in other groups of this subclass
Applicants:
ELSEVIER, INC. [US/US]; 230 Park Avenue, Suite 800 New York, NY 10169, US
Inventors:
GREGORY, Michelle; NL
KAYAL, Subhradeep; NL
TSATSARONIS, Georgios; NL
AFZAL, Zubair; NL
Agent:
WUENNENBERG, Gregory, T.; US
OBERHAUS, Geoffrey, L.; US
TENT, Brian, A.; US
LORENTZ, Joshua, A.; US
BONNER, Anthony, F.; US
Priority Data:
16/020,40827.06.2018US
62/527,43530.06.2017US
Title (EN) SYSTEMS AND METHODS FOR EXTRACTING FUNDER INFORMATION FROM TEXT
(FR) SYSTÈMES ET PROCÉDÉS D'EXTRACTION D'INFORMATIONS DE BAILLEUR DE FONDS À PARTIR D'UN TEXTE
Abstract:
(EN) Systems and methods of extracting funding information from text are disclosed herein. The method includes receiving a text document, extracting paragraphs from the text document using a natural language processing model or a machine learning model, and classifying, using a machine learning classifier, the paragraphs as having funding information or not having funding information. The method further includes labeling, using a first annotator, potential entities within the paragraphs classified as having funding information, and labeling, using a second annotator, potential entities within the paragraphs classified as having funding information, where the first annotator implements a first named-entity recognition model and the second annotator implements a second named-entity recognition model that is different from the first named-entity recognition model. The method further includes extracting the potential entities from the paragraphs classified as having funding information and determining, using an ensemble mechanism, funding information from the potential entities.
(FR) L'invention concerne des procédés et des systèmes permettant d'extraire des informations de bailleur de fonds à partir d'un texte. Le procédé consiste à : recevoir un document de texte ; extraire des paragraphes du document de texte à l'aide d'un modèle de traitement de langage naturel ou d'un modèle d'apprentissage automatique ; et classer, à l'aide d'un classificateur d'apprentissage automatique, des paragraphes comme comprenant des informations de financement ou ne comprenant pas d'informations de financement. Le procédé consiste également à : étiqueter, à l'aide d'un premier dispositif d’annotation, les entités potentielles dans les paragraphes classés comme comprenant des informations de financement ; et étiqueter, à l'aide d'un second dispositif d’annotation, les entités potentielles dans les paragraphes classés comme comprenant des informations de financement, le premier dispositif d’annotation mettant en œuvre un premier modèle de reconnaissance d'entité nommée et le second dispositif d’annotation mettant en œuvre un second modèle de reconnaissance d'entité nommée qui est différent du premier modèle de reconnaissance d'entité nommée. Le procédé consiste également à extraire les entités potentielles des paragraphes classés comme comprenant des informations de financement ainsi qu'à déterminer, à l'aide d'un mécanisme d'ensemble, des informations de financement à partir des entités potentielles.
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)