処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2020261357 - 発話評価装置、発話評価方法、およびプログラム

公開番号 WO/2020/261357
公開日 30.12.2020
国際出願番号 PCT/JP2019/025048
国際出願日 25.06.2019
IPC
G10L 25/60 2013.1
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
25G10L15/00~G10L21/00のグループ中のどれか一つに限定されない音声又は声の分析手法
48特定の用途に特に適合したもの
51比較または判別のためのもの
60音声の信号の質を測定するためのもの
G10L 21/007 2013.1
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
21他の可聴信号,または不可聴信号への音声信号変換処理,例.特性や明瞭性を修正するための視覚,触覚
003声質を変更させるもの,例.ピッチまたはフォルマント
007処理に特徴があるもの
CPC
G10L 21/007
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
21Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
003Changing voice quality, e.g. pitch or formants
007characterised by the process used
G10L 25/60
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
48specially adapted for particular use
51for comparison or discrimination
60for measuring the quality of voice signals
出願人
  • 日本電信電話株式会社 NIPPON TELEGRAPH AND TELEPHONE CORPORATION [JP]/[JP]
発明者
  • 廣谷 定男 HIROYA, Sadao
代理人
  • 中尾 直樹 NAKAO, Naoki
  • 中村 幸雄 NAKAMURA, Yukio
  • 義村 宗洋 YOSHIMURA, Takahiro
優先権情報
公開言語 (言語コード) 日本語 (ja)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) SPEECH ASSESSMENT DEVICE, SPEECH ASSESSMENT METHOD, AND PROGRAM
(FR) DISPOSITIF D'ÉVALUATION DE LA PAROLE, PROCÉDÉ D'ÉVALUATION DE LA PAROLE ET PROGRAMME
(JA) 発話評価装置、発話評価方法、およびプログラム
要約
(EN) The present invention obtains stable assessment results from audio obtained through vocalization of a given sentence. This speech assessment device (1) outputs a score assessing speech in an input audio signal vocalized by a speaker in a first group. A feature quantity extraction unit (11) extracts an acoustic feature quantity from the input audio signal. A conversion unit (12) converts the acoustic feature quantity of the input audio signal into an acoustic feature quantity that is obtained when a speaker in a second group vocalizes the same text as the input audio signal. An assessment unit (13) calculates a score that gets increasingly higher with decreasing distance between the pre-conversion acoustic feature quantity and the post-conversion acoustic feature quantity.
(FR) La présente invention concerne des résultats d'évaluation stables à partir de l'audio obtenu par la vocalisation d'une phrase donnée. Le présent dispositif d'évaluation de la parole (1) délivre en sortie un score d'évaluation de la parole dans un signal audio d'entrée vocalisé par un haut-parleur dans un premier groupe. Une unité d'extraction de quantité de caractéristiques (11) extrait une quantité de caractéristiques acoustiques à partir du signal audio d'entrée. Une unité de conversion (12) convertit la quantité de caractéristiques acoustiques du signal audio d'entrée en une quantité de caractéristiques acoustiques qui est obtenue lorsqu'un haut-parleur dans un second groupe vocalise le même texte que le signal audio d'entrée. Une unité d'évaluation (13) calcule un score qui devient de plus en plus élevé avec une distance décroissante entre la quantité de caractéristiques acoustiques de pré-conversion et la quantité de caractéristiques acoustiques post-conversion.
(JA) 任意の文章を発話した音声から安定した評価結果を得る。発話評価装置(1)は、第一グループの話者が発話した入力音声信号の発話を評価したスコアを出力する。特徴量抽出部(11)は、入力音声信号から音響特徴量を抽出する。変換部(12)は、入力音声信号の音響特徴量を第二グループの話者が入力音声信号と同一のテキストを発話したときの音響特徴量に変換する。評価部(13)は、変換前の音響特徴量と変換後の音響特徴量との距離が近いほど評価が高くなるスコアを算出する。
Related patent documents
JP2021528679This application is not viewable in PATENTSCOPE because the national phase entry has not been published yet or the national entry is issued from a country that does not share data with WIPO or there is a formatting issue or an unavailability of the application.
国際事務局に記録されている最新の書誌情報