WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2001006408) CUT AND PASTE DOCUMENT SUMMARIZATION SYSTEM AND METHOD
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2001/006408    International Application No.:    PCT/US2000/004505
Publication Date: 25.01.2001 International Filing Date: 22.02.2000
Chapter 2 Demand Filed:    05.09.2000    
IPC:
G06F 17/27 (2006.01)
Applicants: THE TRUSTEES OF COLUMBIA UNIVERSITY IN THE CITY OF NEW YORK [US/US]; 116th Street and Broadway, New York, NY 10027 (US) (For All Designated States Except US).
MCKEOWN, Kathleen, R. [US/US]; (US) (For US Only).
JING, Hongyan [US/US]; (US) (For US Only)
Inventors: MCKEOWN, Kathleen, R.; (US).
JING, Hongyan; (US)
Agent: TANG, Henry; Baker & Botts LLP, 30 Rockefeller Plaza, New York, NY 10112-0228 (US)
Priority Data:
60/120,657 19.02.1999 US
Title (EN) CUT AND PASTE DOCUMENT SUMMARIZATION SYSTEM AND METHOD
(FR) CREATION DE RESUMES DE DOCUMENTS PAR COUPER-COLLER ET PROCEDE CORRESPONDANT
Abstract: front page image
(EN)A summary of an input document is generated by extracting at least one sentence from the document and parsing the extracted sentences into components, such as in a parse tree (110). Sentence reduction processing is performed to mark components which can be removed from the parse trees (135). Sentence reduction can include context importance processing, probabilistic processing, and linguistic knowledge based processing, probabilistic processing includes identifying sentence combination operations and establishing rules for applying the sentence combination operations to mark the parse trees to merge at least two sentences (140). Sentence combination processing also provides a paste operation to operate on the marked components to effect the indicated removal and combination of sentence components, thereby generating summary sentences for the input document.
(FR)Selon cette invention, on génère un résumé d'un document entrant en extrayant au moins une phrase dudit document et en effectuant le parsage par composants des phrases extraites, par analogie avec un arbre de parsage (110). Le traitement par réduction de phrases s'effectue de manière à marquer les composants pouvant être retirés des arbres de parsage (135). La réduction de phrases peut comprendre le traitement du contexte par importance, le traitement probabiliste et le traitement fondé sur les connaissances linguistiques. Le traitement par combinaison de phrases consiste à identifier les opérations de combinaison de phrases et à établir des règles pour appliquer les opérations de combinaison de phrases afin de marquer les arbres de parsage destinés à faire fusionner au moins deux phrases (140). Le traitement par combinaison de phrases comprend aussi une opération de collage appliquée aux composants marqués pour effectuer le retrait et la combinaison indiqués de composants d'une phrase, ce qui permet de générer des phrases de résumé à partir du document d'entrée.
Designated States: AE, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, CA, CH, CN, CR, CU, CZ, DE, DK, DM, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, NO, NZ, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TR, TT, TZ, UA, UG, US, UZ, VN, YU, ZA, ZW.
African Regional Intellectual Property Organization (GH, GM, KE, LS, MW, SD, SL, SZ, TZ, UG, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)