WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2002029547) APPARATUS AND METHOD FOR TEXT SEGMENTATION BASED ON COHERENT UNITS
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2002/029547    International Application No.:    PCT/US2001/030734
Publication Date: 11.04.2002 International Filing Date: 02.10.2001
Chapter 2 Demand Filed:    22.03.2002    
IPC:
G06F 7/60 (2006.01), G06F 12/00 (2006.01), G06F 15/00 (2006.01), G06F 17/00 (2006.01), G06F 17/10 (2006.01), G06F 17/21 (2006.01), G06F 17/24 (2006.01), G06F 17/27 (2006.01), G06K 9/00 (2006.01)
Applicants: HEWLETT-PACKARD COMPANY [US/US]; Intellectual Property Administration, P.O. Box 272400, Fort Collins, CO 80527-2400 (US) (For All Designated States Except US).
SHIMIZU, Hiroyuki [JP/JP]; (JP) (For US Only).
NAKAGAWA, Shinya [JP/JP]; (JP) (For US Only)
Inventors: SHIMIZU, Hiroyuki; (JP).
NAKAGAWA, Shinya; (JP)
Agent: GREELEY, Paul, D.; Ohlandt, Greeley, Ruggiero & Perle.L.L.P., 10th floor, One Landmark Square, Stamford, CT 06901-2682 (US)
Priority Data:
2000-302321 02.10.2000 JP
Title (EN) APPARATUS AND METHOD FOR TEXT SEGMENTATION BASED ON COHERENT UNITS
(FR) DISPOSITIF ET PROCEDE DE SEGMENTATION DE TEXTE BASE SUR DES UNITES COHERENTES
Abstract: front page image
(EN)A text segmentation apparatus comprising means for analyzing an electronic text to determine likelihood of segmentation point for each of sentence end in the text based on a coherent unit, and means for segmenting said text into text segments based on the likelihood of segmentation point. The apparatus determines the similarity between the text parts contained in a pair of windows (Step 3) to be set up on the left and right sides of each sentence end position in the text so as to obtain similarity curves (Step 4). Then, the apparatus determines the likelihood of segmentation point (Step 5) for each sentence end point based on the obtained similarity curves, and segments the text at the point having the best likelihood of segmentation point (Step 6).
(FR)L'invention concerne un dispositif de segmentation de texte comprenant des moyens permettant d'analyser un texte électronique afin de déterminer la vraisemblance d'un point de segmentation pour chaque fin de phrase du texte, en fonction d'une unité cohérente, et des moyens permettant de segmenter ce texte en segments en fonction de la vraisemblance d'un point de segmentation. Ce dispositif détermine la similarité entre les parties de texte contenues dans deux fenêtres (étape 3) définies du côté gauche et du côté droit de chaque position de fin de phrase dans le texte afin d'obtenir des courbes de similarité (étape 4). Le dispositif détermine ensuite la vraisemblance d'un point de segmentation (étape 5) pour chaque point de fin de phrase à partir des courbes de similarité déterminées, et segmente le texte au niveau du point présentant de degré de vraisemblance de point de segmentation le plus élevé (étape 6).
Designated States: US.
European Patent Office (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE, TR).
Publication Language: English (EN)
Filing Language: English (EN)