WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2009084554) DISPOSITIF DE SEGMENTATION DE TEXTE, PROCÉDÉ DE SEGMENTATION DE TEXTE ET PROGRAMME
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2009/084554    N° de la demande internationale :    PCT/JP2008/073502
Date de publication : 09.07.2009 Date de dépôt international : 25.12.2008
Demande présentée en vertu du Chapitre 2 :    24.07.2009    
CIB :
G06F 17/30 (2006.01)
Déposants : NEC CORPORATION [JP/JP]; 7-1, Shiba 5-chome, Minato-ku, Tokyo 1088001 (JP) (Tous Sauf US).
TERAO, Makoto [JP/JP]; (JP) (US Seulement).
KOSHINAKA, Takafumi [JP/JP]; (JP) (US Seulement)
Inventeurs : TERAO, Makoto; (JP).
KOSHINAKA, Takafumi; (JP)
Mandataire : KATO, Asamichi; c/o A. Kato & Associates 20-12 Shin-Yokohama 3-chome Kohoku-ku, Yokohama-shi Kanagawa 2220033 (JP)
Données relatives à la priorité :
2007-336400 27.12.2007 JP
Titre (EN) TEXT SEGMENTATION DEVICE, TEXT SEGMENTATION METHOD, AND PROGRAM
(FR) DISPOSITIF DE SEGMENTATION DE TEXTE, PROCÉDÉ DE SEGMENTATION DE TEXTE ET PROGRAMME
(JA) テキスト分割装置とテキスト分割方法およびプログラム
Abrégé : front page image
(EN)A device, method, and program which precisely and properly segment an inputted text into desired topic units. The device is provided with a model base topic segmentation means (102) which segments the text using a topic model expressing a semantical group when segmenting the text by each topic, a parameter estimation means (103) which estimates a control parameter in the case of segmenting the text on the basis of the change-point detection of word distribution within the text with the result of the segmentation obtained by the model base topic segmentation means as an instructor, and a change-point detection topic segmentation means (104) which segments the text on the basis of the change-point detection of the word distribution within the text using the parameter estimated by the parameter estimation means.
(FR)L'invention concerne un dispositif, un procédé et un programme qui segmentent précisément et correctement un texte entré en des unités de sujet souhaitées. Le dispositif est pourvu de moyens de segmentation de sujet de base de modèle (102) qui segmentent le texte en utilisant un modèle de sujet exprimant un groupe sémantique lors de la segmentation du texte par chaque sujet, des moyens d'estimation de paramètre (103) qui estiment un paramètre de commande dans le cas de segmentation du texte sur la base de la détection de point de changement de distribution de mots dans le texte avec le résultat de la segmentation obtenu par les moyens de segmentation de sujet de base de modèle en tant qu'instructeur, et des moyens de segmentation de sujet de détection de point de changement (104) qui segmentent le texte sur la base de la détection de point de changement de la distribution de mots dans le texte au moyen du paramètre estimé par les moyens d'estimation de paramètre.
(JA) 本発明は、入力テキストを所望の話題単位へ精度よく適正にテキスト分割する装置、方法、プログラムの提供する。テキストを話題ごとに分割する際に、意味的なまとまりを表す話題モデルを用いて前記テキストを分割するモデルベース話題分割手段102と、前記モデルベース話題分割手段による分割結果を教師として、前記テキスト内の単語分布の変化点検出に基づいて前記テキストを分割する際の制御パラメータを推定するパラメータ推定手段103と、前記パラメータ推定手段が推定したパラメータを用いて、前記テキスト内の単語分布の変化点検出に基づいて前記テキストを分割する変化点検出話題分割手段104とを備える(図1)。
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
Office européen des brevets (OEB) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MT, NL, NO, PL, PT, RO, SE, SI, SK, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Langue de publication : japonais (JA)
Langue de dépôt : japonais (JA)