Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Tuesday 25.01.2022 at 12:00 PM CET
Settings

Settings

Goto Application

1. WO2022003967 - SPEECH UNDERSTANDING ASSISTANCE SYSTEM, METHOD, DEVICE, AND PROGRAM

Publication Number WO/2022/003967
Publication Date 06.01.2022
International Application No. PCT/JP2020/026249
International Filing Date 03.07.2020
IPC
G06F 16/332 2019.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
30of unstructured textual data
33Querying
332Query formulation
Applicants
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
Inventors
  • 小倉 毅 OGURA, Tsuyoshi
  • 小河原 成哲 OGAWARA, Masanori
  • 山口 高弘 YAMAGUCHI, Takahiro
Agents
  • 岡田 賢治 OKADA, Kenji
  • 畑 雅明 HATA, Masaaki
  • 今下 勝博 IMASHITA, Katsuhiro
Priority Data
Publication Language Japanese (ja)
Filing Language Japanese (JA)
Designated States
Title
(EN) SPEECH UNDERSTANDING ASSISTANCE SYSTEM, METHOD, DEVICE, AND PROGRAM
(FR) SYSTÈME, PROCÉDÉ, DISPOSITIF ET PROGRAMME D'ASSISTANCE À LA COMPRÉHENSION DE LA PAROLE
(JA) 発話理解支援システム、方法、装置及びプログラム
Abstract
(EN) The purpose of the present invention is to provide a system having the function wherein, when ambiguity is present in speech exchanged in a communication system over a computer network such that an entity or content referred to by a noun or an expression corresponding to a noun cannot be identified, the accurate semantic content thereof or information serving as a clue to understanding the same does not serve as a response to a question created by a user, only information related to the spoken sentence or the speaker is retrieved from the clue, and the results thereof are presented to the user. The present disclosure relates to a communication system operated over a computer network and having: a spoken sentence analysis unit that inputs, by character input, speech by a user who is a participant in communication, and that performs structural analysis and contextual analysis, which is based on a speech log, for each spoken sentence that has been input; an ambiguous location designation function for designating the location of an entity referred to by a noun in the speech when a user feels that there is ambiguity regarding said entity; a background knowledge extraction unit that references the content of a document file group created and accumulated through a variety of activities of a user who is participating in or may participate in communication, and that extracts information serving as background knowledge for the communication; a background knowledge database that holds the background knowledge extracted by the background knowledge extraction unit in a database format; a database search unit that searches the background knowledge database to identify the entity referred to by the noun designated by the ambiguous location designation function; and a content explanation display unit that displays information explaining the entity referred to by the noun designated as ambiguous and identified by the search results of the database search unit, the information being displayed only to the user who performed the ambiguous designation. It is thereby possible to identify the entity of the noun including ambiguity in the speech on the basis of the background knowledge, which is based on the content of the accumulated document file group, and to clearly indicate the entity to the user.
(FR) Le but de la présente invention est de proposer un système ayant la fonction dans laquelle, lorsqu'une ambiguïté est présente dans la parole échangée dans un système de communication sur un réseau informatique de sorte qu'une entité ou un contenu désigné par un nom ou une expression correspondant à un nom ne peut pas être identifié, le contenu sémantique précis de celle-ci ou des informations servant d'indice pour la comprendre ne sert pas de réponse à une question créée par un utilisateur, seules des informations relatives à la phrase énoncée ou au locuteur sont récupérées à partir de l'indice, et les résultats de celles-ci sont présentés à l'utilisateur. La présente divulgation concerne un système de communication fonctionnant sur un réseau informatique et comprenant : une unité d'analyse de phrase énoncée qui entre, par l'entrée de caractères, la parole d'un utilisateur qui est un participant en communication, et qui effectue une analyse structurale et une analyse contextuelle, qui sont basées sur un journal de paroles, pour chaque phrase énoncée qui a été entrée ; une fonction de désignation d'emplacement ambiguë pour désigner l'emplacement d'une entité désignée par un nom dans la parole lorsqu'un utilisateur perçoit qu'il y a une ambiguïté concernant ladite entité ; une unité d'extraction de connaissances d'arrière-plan qui référence le contenu d'un groupe de fichiers de documents créé et regroupé par l'intermédiaire d'une variété d'activités d'un utilisateur qui participe ou peut participer à la communication, et qui extrait des informations servant de connaissances d'arrière-plan pour la communication ; une base de données de connaissances d'arrière-plan qui conserve les connaissances d'arrière-plan extraites par l'unité d'extraction de connaissances d'arrière-plan dans un format de base de données ; une unité de recherche de base de données qui recherche la base de données de connaissances d'arrière-plan pour identifier l'entité désignée par le nom indiqué par la fonction de désignation d'emplacement ambiguë ; et une unité d'affichage d'explication de contenu qui affiche des informations expliquant l'entité désignée par le nom indiqué comme ambigu et identifié par les résultats de recherche de l'unité de recherche de base de données, les informations étant affichées uniquement à l'utilisateur qui a effectué la désignation ambiguë. Il est ainsi possible d'identifier l'entité du nom comprenant une ambiguïté dans la parole sur la base de la connaissance d'arrière-plan, qui est basée sur le contenu du groupe de fichiers de documents regroupés, et d'indiquer clairement l'entité à l'utilisateur.
(JA) 本発明は、コンピュータネットワークを介したコミュニケーションシステムにおいて交わされる発話の中に、名詞、あるいは、名詞に相当する表現が指す実体や内容が特定できないという曖昧性が存在する場合に、その正確な意味内容、あるいは、それを理解する手がかりとなる情報を、ユーザが作成した質問文への応答ではなく、発話文や発話者に関する情報だけを手掛かりに検索し、結果をユーザに提示する機能を持つシステムを提供することを目的としている。 本開示は、コンピュータネットワークを介したコミュニケーションシステムであって、コミュニケーションの参加者であるユーザの発話を文字入力によって入力し、入力された個々の発話文の構造解析、および、発話の履歴に基づく文脈解析とを行う発話文解析部と、ユーザが、発話内の名詞が指す実体に対して曖昧性を感じたときにその箇所を指定するための曖昧箇所指定機能と、コミュニケーションに参加している、あるいは、参加する可能性のあるユーザによる各種の活動によって作成、蓄積された文書ファイル群の内容を参照し、コミュニケーションの背景知識となる情報を抽出する背景知識抽出部と、背景知識抽出部が抽出した背景知識をデータベースの形で保持する背景知識データベースと、曖昧箇所指定機能によって指定された名詞が指す実体を特定するために前記背景知識データベースを検索するデータベース検索部と、データベース検索部による検索の結果によって特定された、前記の曖昧指定された名詞が指す実体を説明する情報を、前記の曖昧指定を行ったユーザに対してのみ表示する内容説明表示部、とを有することによって、発話内の曖昧性を含む名詞の実体を、蓄積された文書ファイル群の内容に基づく背景知識を根拠として特定し、ユーザに明示することを可能にする。
Latest bibliographic data on file with the International Bureau