処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2020158409 - 要約生成装置、方法、プログラム、及び記憶媒体

公開番号 WO/2020/158409
公開日 06.08.2020
国際出願番号 PCT/JP2020/001250
国際出願日 16.01.2020
IPC
G10L 15/10 2006.01
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15音声認識
08音声の識別または探索
10未知音声と標準パタンとの距離または歪みを用いるもの
G10L 15/12 2006.01
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15音声認識
08音声の識別または探索
12動的計画法を用いるもの,例.動的時間伸縮[7]
CPC
G10L 15/10
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
10using distance or distortion measures between unknown speech and reference templates
G10L 15/12
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
08Speech classification or search
12using dynamic programming techniques, e.g. dynamic time warping [DTW]
出願人
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
発明者
  • 平尾 努 HIRAO, Tsutomu
  • 小川 厚徳 OGAWA, Atsunori
  • 中谷 智広 NAKATANI, Tomohiro
  • 永田 昌明 NAGATA, Masaaki
代理人
  • 特許業務法人太陽国際特許事務所 TAIYO, NAKAJIMA & KATO
優先権情報
2019-01221028.01.2019JP
公開言語 (言語コード) 日本語 (JA)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) ABSTRACT GENERATION DEVICE, METHOD, PROGRAM, AND RECORDING MEDIUM
(FR) DISPOSITIF, PROCÉDÉ, PROGRAMME ET SUPPORT D’INFORMATIONS POUR GÉNÉRATION DE RÉSUMÉ
(JA) 要約生成装置、方法、プログラム、及び記憶媒体
要約
(EN)
A speech recognition unit (12) converts an utterance series having been input into a confusion network series that is composed of k-best of candidate words as an output of speech recognition; a lattice generation unit (14) designates candidate words as internal nodes and a group of k candidate words for the same speech as an external node from the confusion network series, and generates a lattice series that places edges among internal nodes other than internal nodes contained in the same external node; an integer programming problem generation unit (16) generates an integer programming problem for selecting a path to maximize an objective function that includes at least a coverage score for an important word from among paths that follow the internal nodes with the edges placed thereamong in the lattice series; and an abstract generation unit generates a high-quality abstract that has reduced speech recognition errors and lower redundancy by using the candidate words represented by the internal nodes included in the path selected by solving the integer programming problem under constraints associated with the length of the abstract to be generated.
(FR)
Une unité de reconnaissance vocale (12) convertit une série d’énoncés qui ont été entrés en une série de réseaux de confusion qui est composée des k meilleurs mots candidats en tant que sortie de reconnaissance vocale ; une unité de génération de maille (14) désigne des mots candidats en tant que nœuds internes et un groupe de k mots candidats pour les mêmes paroles en tant que nœud externe à partir de la série de réseaux de confusion, et génère une série de mailles qui place des bords parmi des nœuds internes autres que des nœuds internes contenus dans le même nœud externe ; une unité de génération de problème de programmation d’entier (16) génère un problème de programmation d’entier pour sélectionner un chemin pour maximiser une fonction objective qui inclut au moins un score de couverture pour un mot important parmi des chemins qui suivent les nœuds internes avec les bords placés entre ces derniers dans la série de mailles ; et une unité de génération de résumé génère un résumé de grande qualité qui présente des erreurs de reconnaissance vocale réduites et une plus faible redondance à l’aide des mots candidats représentés par les nœuds internes inclus dans le chemin sélectionné par résolution du problème de programmation d’entier avec des contraintes associées à la longueur du résumé à générer.
(JA)
音声認識部(12)が、入力された発話系列を、音声認識結果の候補単語のk-bestで構成されるコンフュージョンネットワーク系列に変換し、ラティス生成部(14)が、コンフュージョンネットワーク系列から、候補単語を内部ノード、同じ音声に対するk個の候補単語をまとめたものを外部ノードとし、同一の外部ノードに含まれる内部ノード間以外の内部ノード間にエッジを張ったラティス系列を生成し、整数計画問題生成部(16)が、ラティス系列において、エッジを張られた内部ノードを辿る経路のうち、少なくとも重要単語の被覆スコアを含む目的関数を最大化する経路を選択するための整数計画問題を生成し、要約生成部が、生成される要約の長さに関する制約の下、整数計画問題を解くことにより選択される経路に含まれる内部ノードが示す候補単語を用いて、音声認識誤りが少なく、かつ冗長性の低い高品質な要約を生成する。
他の公開
国際事務局に記録されている最新の書誌情報