Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO2017032427) IDENTIFYING AUGMENTED FEATURES BASED ON A BAYESIAN ANALYSIS OF A TEXT DOCUMENT
Latest bibliographic data on file with the International Bureau   

Pub. No.: WO/2017/032427 International Application No.: PCT/EP2015/069697
Publication Date: 02.03.2017 International Filing Date: 27.08.2015
IPC:
G06F 17/30 (2006.01) ,G06K 9/00 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
30
Information retrieval; Database structures therefor
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
K
RECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9
Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
Applicants:
LONGSAND LIMITED [GB/GB]; Autonomy House Cambridge Business Park Cowley Road Cambridge Cambridgeshire CB4 0WZ, GB
Inventors:
BLANCHFLOWER, Sean; GB
OGDEN, Christopher; GB
FOTHERGILL, Simon; GB
Agent:
EIP; Fairfax House 15 Fulwood Place London Greater London WC1V 6HU, GB
Priority Data:
Title (EN) IDENTIFYING AUGMENTED FEATURES BASED ON A BAYESIAN ANALYSIS OF A TEXT DOCUMENT
(FR) IDENTIFICATION DE CARACTÉRISTIQUES AUGMENTÉES SUR LA BASE D'UNE ANALYSE BAYÉSIENNE D'UN DOCUMENT-TEXTE
Abstract:
(EN) Identification of augmented features based on a Bayesian analysis of a text document is disclosed. One example is a system including a document processing module, a feature processing module,and a feature generation module. The document processing module receives a text document via a processor. The feature processing module automatically identifies, based on a Bayesian analysis of the text document, a plurality of augmented features in the text document, the plurality of augmented features including at least one of local, sectional, and document-level features of the text document, and extracts, via the processor, the identified plurality of augmented features from the text document. The feature generation module generates, via the processor, a feature representation of the text document based on the extracted plurality of augmented features.
(FR) La présente invention concerne l'identification de caractéristiques augmentées sur la base d'une analyse bayésienne d'un document-texte. Un système donné à titre d'exemple comprend un module de traitement de document, un module de traitement de caractéristiques, et un module de génération de caractéristiques. Le module de traitement de document reçoit un document-texte par l'intermédiaire d'un processeur. Le module de traitement de caractéristiques identifie automatiquement, sur la base d'une analyse bayésienne du document-texte, une pluralité de caractéristiques augmentées dans le document-texte, la pluralité de caractéristiques augmentées comprenant au moins un type de caractéristiques parmi des caractéristiques de niveau local, de section et de document, et extrait, par l'intermédiaire du processeur, la pluralité identifiée de caractéristiques augmentées à partir du document-texte. Le module de génération de caractéristiques génère, par l'intermédiaire du processeur, une représentation de caractéristiques du document-texte sur la base de la pluralité extraite de caractéristiques augmentées.
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: English (EN)
Filing Language: English (EN)