Search International and National Patent Collections
Some content of this application is unavailable at the moment.
If this situation persist, please contact us atFeedback&Contact
1. (WO1999021106) AUTOMATICALLY RECOGNIZING THE DISCOURSE STRUCTURE OF A BODY OF TEXT
Latest bibliographic data on file with the International Bureau

Pub. No.: WO/1999/021106 International Application No.: PCT/US1998/021785
Publication Date: 29.04.1999 International Filing Date: 15.10.1998
Chapter 2 Demand Filed: 20.05.1999
IPC:
G06F 17/27 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
20
Handling natural language data
27
Automatic analysis, e.g. parsing, orthograph correction
Applicants:
MICROSOFT CORPORATION [US/US]; One Microsoft Way Redmond, WA 98052-6399, US
Inventors:
CORSTON, Simon; US
Agent:
KELLY, Joseph, R.; Westman, Champlin & Kelly, P.A. Suite 1600 International Centre 900 Second Avenue South Minneapolis, MN 55402-3319, US
Priority Data:
08/954,63620.10.1997US
Title (EN) AUTOMATICALLY RECOGNIZING THE DISCOURSE STRUCTURE OF A BODY OF TEXT
(FR) RECONNAISSANCE AUTOMATIQUE DE LA STRUCTURE DE DISCOURS D'UN CORPS DE TEXTE
Abstract:
(EN) The present invention is directed to recognizing a discourse structure of a body of text. In a preferred embodiment, a discourse structure recognition facility utilizes syntactic information associated with the body of text to generate a discourse structure tree that characterizes the discourse structure of the body of text. The facility first identifies in the body of text a number of clauses. The facility then determines, for each distinct pair of clauses, which of a number of possible discourse relations should be hypothesized between the pair of clauses, based on the syntactic structure and semantic of the body of text relative to the pair of clauses. The facility then applies the hypothesized relations to the clauses in order to produce a discourse structure tree characterizing the discourse structure of the body of text. In certain embodiments, the facility further generates from the produced discourse structure tree a synopsis of the body of text reflecting the primary goals pursued by its author.
(FR) La présente invention se rapporte à la reconnaissance automatique de la structure de discours d'un corps de texte. Dans une réalisation préférée, une fonction de reconnaissance de la structure de discours utilise les informations syntaxiques associées au corps de texte pour générer un arbre de structure de discours qui caractérise la structure de discours du corps de texte. Cette fonction identifie tout d'abord un certain nombre de clauses dans le corps du texte. Puis la fonction détermine, pour chaque paire distincte de clauses, quelle est, parmi diverses relations de discours possibles, celle qui doit servir de relation hypothétique entre les deux clauses, en fonction de la structure syntaxique et sémantique du corps de texte en rapport avec les deux clauses. La fonction applique ensuite les relations hypothétiques aux clauses de manière à produire un arbre de structure de discours caractérisant la structure du discours du corps de texte. Dans certaines réalisations, la fonction génère en outre à partir de l'arbre produit de structure du discours, un synopsis du corps de texte reflétant les buts principaux recherchés par l'auteur.
front page image
Designated States: CA, CN, JP
European Patent Office (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE)
Publication Language: English (EN)
Filing Language: English (EN)