Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

1. WO2012008503 - APPAREIL D'EXTRACTION DE PASSAGE ET PROCÉDÉ D'EXTRACTION DE PASSAGE

Numéro de publication WO/2012/008503
Date de publication 19.01.2012
N° de la demande internationale PCT/JP2011/066017
Date du dépôt international 13.07.2011
CIB
G06F 17/30 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
30Recherche documentaire; Structures de bases de données à cet effet
CPC
G06F 16/313
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
31Indexing; Data structures therefor; Storage structures
313Selection or weighting of terms for indexing
Déposants
  • 国立大学法人横浜国立大学 NATIONAL UNIVERSITY CORPORATION YOKOHAMA NATIONAL UNIVERSITY [JP/JP]; 神奈川県横浜市保土ヶ谷区常盤台79番1号 79-1,Tokiwadai,Hodogaya-ku,Yokohama-shi Kanagawa 2408501, JP (AllExceptUS)
  • 森 辰則 MORI Tatsunori [JP/JP]; JP (UsOnly)
  • 渋木 英潔 SHIBUKI Hideyuki [JP/JP]; JP (UsOnly)
  • 中野 正寛 NAKANO Masahiro [JP/JP]; JP (UsOnly)
  • 宮▲崎▼ 林太郎 MIYAZAKI Rintaro [JP/JP]; JP (UsOnly)
  • 石下 円香 ISHIOROSHI Madoka [JP/JP]; JP (UsOnly)
Inventeurs
  • 森 辰則 MORI Tatsunori; JP
  • 渋木 英潔 SHIBUKI Hideyuki; JP
  • 中野 正寛 NAKANO Masahiro; JP
  • 宮▲崎▼ 林太郎 MIYAZAKI Rintaro; JP
  • 石下 円香 ISHIOROSHI Madoka; JP
Mandataires
  • 竹内 三明 TAKEUCHI Mitsuaki; 神奈川県藤沢市鵠沼石上1丁目4番13号ロコテラス湘南302号室 相州国際特許事務所 SOUSYU INTERNATIONAL PATENT FIRM,Loco-Terrace SHOHNAN 302,4-13,Kugenuma-Ishigami 1-chome,Fujisawa-shi Kanagawa 2510025, JP
Données relatives à la priorité
2010-15867913.07.2010JP
Langue de publication japonais (JA)
Langue de dépôt japonais (JA)
États désignés
Titre
(EN) PASSAGE EXTRACTION APPARATUS AND METHOD OF PASSAGE EXTRACTION
(FR) APPAREIL D'EXTRACTION DE PASSAGE ET PROCÉDÉ D'EXTRACTION DE PASSAGE
(JA) パッセージ抽出装置及びパッセージ抽出方法
Abrégé
(EN)
Disclosed is a passage extraction apparatus and so forth whereby a Web or a document database is searched, and a direct mediatory summary whereby a passage briefly explaining a situation wherein a focus sentence determined to be true or false is established along with a situation wherein an opposing sentence for an opposition is established is extracted. In particular, the relevance and impartiality with the focus sentence and the density of characteristic language is considered. A document is searched for with a focus statement as a condition; in addition a document is searched for with an opposing statement as a condition; a pure focus search document collection relating only to the focus statement and a pure opposing search document collection relating only to the opposing statement are classified (S103); a word score is calculated (S104, S105) from the frequency of pure focus search documents and from the frequency of pure opposing search documents; in addition the characteristic language of the affirmative argument and the characteristic language of the negative argument are determined (S2801); and a sentence score is obtained from the characteristic language (S3501) and a passage score is calculated (S107).
(FR)
L'invention concerne un appareil d'extraction de passage et ainsi de suite par lequel une recherche dans une base de données Web ou de documents est effectuée, et un résumé médiateur direct par lequel un passage expliquant brièvement une situation dans laquelle une phrase d'intérêt déterminée comme étant vraie ou fausse est établie ainsi qu'une situation dans laquelle une phrase opposée pour une opposition est établie est extrait. En particulier, l'intérêt et l'impartialité avec la phrase d'intérêt et la densité du langage caractéristique sont considérés. Un document est recherché avec une spécification d'intérêt en tant que condition ; de plus, un document est recherché avec une spécification opposée en tant que condition ; un pur ensemble de documents de recherche d'intérêt concernant uniquement la spécification d'intérêt et un pur ensemble de documents de recherche opposé ne concernant que la spécification opposée sont classifiés (S103) ; un score de mot est calculé (S104, S105) à partir de la fréquence des documents de recherche d'intérêt purs et à partir de la fréquence des documents de recherche opposés purs ; de plus, le langage caractéristique de l'argument affirmatif et le langage caractéristique de l'argument négatif sont déterminés (S2801) ; et un score de phrase est obtenu à partir du langage caractéristique (S3501) et un score de passage est calculé (S107).
(JA)
Webや文書データベースを検索し、真偽が判断される着目文が成立する状況とともに、反対の対立文が成立する状況を端的に説明したパッセージを抽出する直接調停要約に関する。特に、着目文との関連性、公平性、及び特徴語の密集度に配慮する。着目言明を条件として文書を検索し、更に対立言明を条件として文書を検索し、着目言明のみに関連する純着目検索文書集合と、対立言明のみに関連する純着目検索文書集合に分別し(S103)、各単語の純着目検索文書頻度と純対立検索文書頻度から単語スコアを算出し(S104,S105)、更に肯定側特徴語、否定側特徴語、トピック特徴語を判定し(S2801)、特徴語から文スコアを求めて(S3501)、パッセージスコアを算出する(S107)。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international