Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020109921 - PROCÉDÉ D'EXTRACTION DE DOCUMENTS, SYSTÈME D'EXTRACTION DE DOCUMENTS, PROGRAMME, ET SUPPORT DE STOCKAGE NON TEMPORAIRE LISIBLE PAR ORDINATEUR

Numéro de publication WO/2020/109921
Date de publication 04.06.2020
N° de la demande internationale PCT/IB2019/059907
Date du dépôt international 19.11.2019
CIB
G06F 16/33 2019.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
16Recherche d’informations; Structures de bases de données à cet effet; Structures de systèmes de fichiers à cet effet
30de données textuelles non structurées
33Requêtes
G06F 16/338 2019.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
16Recherche d’informations; Structures de bases de données à cet effet; Structures de systèmes de fichiers à cet effet
30de données textuelles non structurées
33Requêtes
338Présentation des résultats des requêtes
CPC
G06F 16/33
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
G06F 16/338
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
338Presentation of query results
Déposants
  • 株式会社半導体エネルギー研究所 SEMICONDUCTOR ENERGY LABORATORY CO., LTD. [JP]/[JP]
Inventeurs
  • 岡野達也 OKANO, Tatsuya
  • 齊藤祥子 SAITO, Shoko
Données relatives à la priorité
2018-22482530.11.2018JP
Langue de publication japonais (JA)
Langue de dépôt japonais (JA)
États désignés
Titre
(EN) DOCUMENT RETRIEVAL METHOD, DOCUMENT RETRIEVAL SYSTEM, PROGRAM, AND NON-TEMPORARY COMPUTER-READABLE STORAGE MEDIUM
(FR) PROCÉDÉ D'EXTRACTION DE DOCUMENTS, SYSTÈME D'EXTRACTION DE DOCUMENTS, PROGRAMME, ET SUPPORT DE STOCKAGE NON TEMPORAIRE LISIBLE PAR ORDINATEUR
(JA) 文書検索方法、文書検索システム、プログラム、及び非一時的コンピュータ可読記憶媒体
Abrégé
(EN)
In the present invention, similar documents are retrieved for each block of a given document. Documents are retrieved with a high degree of accuracy. A specific sentence block is retrieved from among a plurality of sentence blocks created by dividing up each of a plurality of documents subject to retrieval. A first retrieval sentence block, which is a portion of a retrieval document, is prepared. By performing full text search, for at least some of the plurality of sentence blocks as a first subject, using the first retrieval sentence block as a retrieval condition, a first degree of relevance to the first retrieval sentence block is calculated for each sentence block included in the first subject. A second subject is determined from the first subject on the basis of the level of the first degree of relevance. A first degree of similarity to each sentence included in the second subject is calculated for each sentence included in the first retrieval sentence block. The first degree of similarity is used to retrieve at least one sentence block similar to the first retrieval sentence block.
(FR)
Dans la présente invention, des documents similaires sont extraits pour chaque bloc d'un document donné. Des documents sont extraits avec un haut degré de précision. Un bloc de phrase spécifique est extrait parmi une pluralité de blocs de phrases créés en divisant chaque document d'une pluralité de documents soumis à l'extraction. Un premier bloc d'extraction de phrases, qui est une partie d'un document d'extraction, est préparé. En effectuant une recherche en texte intégral, pour au moins une partie de la pluralité de blocs de phrases en tant que premier sujet, en utilisant le premier bloc d'extraction de phrases comme condition d'extraction, un premier degré de pertinence vis-à-vis du premier bloc d'extraction de phrases est calculé pour chaque bloc de phrases compris dans le premier sujet. Un second sujet est déterminé à partir du premier sujet d'après le niveau du premier degré de pertinence. Un premier degré de similarité vis-à-vis de chaque phrase compris dans le second sujet est calculé pour chaque phrase comprise dans le premier bloc d'extraction de phrases. Le premier degré de similarité est utilisé pour extraire au moins un bloc de phrases similaire au premier bloc d'extraction de phrases.
(JA)
文書のブロックごとに、類似する文書を検索する。高い精度で文書を検索する。 複数の検索対象文書をそれぞれ分割することで作成された複数の文章ブロックの中から、特定の文 章ブロックを検索する。検索用文書の一部である、第1の検索用文章ブロックを準備し、複数の文 章ブロックのうち少なくとも一部を第1の対象として、第1の検索用文章ブロックを検索条件に用 いて全文検索を行うことで、第1の対象に含まれる文章ブロックそれぞれの、第1の検索用文章ブ ロックに対する第1の関連度を算出し、第1の関連度の高さに基づいて、第1の対象の中から第2 の対象を決定し、第1の検索用文章ブロックに含まれる文ごとに、第2の対象に含まれる文それぞ れとの第1の類似度を算出し、第1の類似度を用いて、第1の検索用文章ブロックに類似する文章 ブロックを少なくとも1つ検索する。
Dernières données bibliographiques dont dispose le Bureau international