WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2013117872) METHOD FOR IDENTIFYING A SET OF SENTENCES IN A DIGITAL DOCUMENT, METHOD FOR GENERATING A DIGITAL DOCUMENT, AND ASSOCIATED DEVICE
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2013/117872    International Application No.:    PCT/FR2013/050269
Publication Date: 15.08.2013 International Filing Date: 08.02.2013
IPC:
G06F 17/30 (2006.01)
Applicants: MINING ESSENTIAL [FR/FR]; 85 Rue Camille Groult F-94400 Vitry Sur Seine (FR)
Inventors: LEHMAM, Abderrafih; (FR)
Agent: CAMUS, Olivier; Cabinet CAMUS LEBKIRI 87 Rue Taitbout F-75009 Paris (FR)
Priority Data:
1251241 09.02.2012 FR
Title (EN) METHOD FOR IDENTIFYING A SET OF SENTENCES IN A DIGITAL DOCUMENT, METHOD FOR GENERATING A DIGITAL DOCUMENT, AND ASSOCIATED DEVICE
(FR) PROCEDE D'IDENTIFICATION D'UN ENSEMBLE DE PHRASES D'UN DOCUMENT NUMERIQUE, PROCEDE DE GENERATION D'UN DOCUMENT NUMERIQUE, DISPOSITIF ASSOCIE
Abstract: front page image
(EN)The invention relates to a method for generating a digital document, known as a "digital summary", said method comprising: a parameterisation step for defining a first degree of summarisation of a first digital document defining a first ratio between a first number representing the quantity of data contained in the desired digital abstract and a second number representing the quantity of data contained in the first document; an analysis step for analysing the first digital document, comprising the definition of a set of terms, known as TAG; a segmentation step for (i) determining a first set of sentences in the first document or (ii) associating a weighting with each of the sentences; an extraction step for extracting a number of sentences according to the degree of condensation; and a generation step for generating a digital abstract comprising a set of ordered sentences.
(FR)Le procédé de génération d'un document numérique, noté « résumé numérique », comprend : une étape de paramétrage permettant de définir un premier degré de condensation d'un premier document numérique définissant un rapport entre un premier nombre représentant la quantité de données contenues dans le résumé numérique souhaité et un second nombre représentant la quantité de données contenues dans le premier document; · une étape d'analyse du premier document numérique comprenant la définition d'un ensemble de termes, noté TAG; · une étape de segmentation permettant de : o déterminer un premier ensemble de phrases du premier document; o associer une pondération à chacune des phrases · une étape d'extraction d'un nombre de phrases selon le degré de condensation; · une étape de génération d'un résumé numérique comprenant un ensemble de phrases ordonnées.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Publication Language: French (FR)
Filing Language: French (FR)