処理中

しばらくお待ちください...

設定

設定

1. WO2015025788 - 定量的F0パターン生成装置及び方法、並びにF0パターン生成のためのモデル学習装置及び方法

公開番号 WO/2015/025788
公開日 26.02.2015
国際出願番号 PCT/JP2014/071392
国際出願日 13.08.2014
IPC
G10L 13/10 2013.01
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
13音声の合成;テキストを音声に変換するシステム
08テキストから音声を合成するための,テキストの分析,またはパラメータの生成,例.表記素から音素への変換,韻律の生成または強勢またはイントネーションの決定
10テキストから導き出された韻律規則;強調またはイントネーション
G10L 13/06 2013.01
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
13音声の合成;テキストを音声に変換するシステム
06音声合成器で使われる音声素片;結合規則
CPC
G10L 13/027
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
02Methods for producing synthetic speech; Speech synthesisers
027Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
G10L 13/086
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
086Detection of language
G10L 13/10
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
10Prosody rules derived from text; Stress or intonation
G10L 21/0205
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
21Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
02Speech enhancement, e.g. noise reduction or echo cancellation
0202Applications
0205Enhancement of intelligibility of clean or coded speech
G10L 25/18
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00-G10L21/00
03characterised by the type of extracted parameters
18the extracted parameters being spectral information of each sub-band
出願人
  • 国立研究開発法人情報通信研究機構 NATIONAL INSTITUTE OF INFORMATION AND COMMUNICATIONS TECHNOLOGY [JP/JP]; 東京都小金井市貫井北町4-2-1 4-2-1 Nukui-Kitamachi, Koganei-shi, Tokyo 1848795, JP
発明者
  • 倪 晋富 NI, Jinfu; JP
  • 志賀 芳則 SHIGA, Yoshinori; JP
代理人
  • 清水 敏 SHIMIZU, Satoshi; JP
優先権情報
2013-17363423.08.2013JP
公開言語 (言語コード) 日本語 (JA)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) QUANTITATIVE F0 PATTERN GENERATION DEVICE AND METHOD, AND MODEL LEARNING DEVICE AND METHOD FOR GENERATING F0 PATTERN
(FR) DISPOSITIF ET PROCÉDÉ DE GÉNÉRATION QUANTITATIVE MOTIF F0, ET DISPOSITIF ET PROCÉDÉ D'APPRENTISSAGE DE MODÈLES POUR LA GÉNÉRATION D'UN MOTIF F0
(JA) 定量的F0パターン生成装置及び方法、並びにF0パターン生成のためのモデル学習装置及び方法
要約
(EN)
[Problem] To provide a synthesizer for F0 patterns using a statistic model whereby correlation between linguistic information and the F0 patterns becomes clear while maintaining accuracy. [Solution] An HMM learning device includes: a parameter estimation unit which represents an F0 pattern (133) fitting to a continuous F0 pattern (132) as a sum of a phrase component and an accent component, and estimates the target points of these components; and an HMM learning means for learning an HMM (139) using the F0 pattern as learning data after the F0 pattern fits to the continuous F0 pattern. The continuous F0 pattern (132) may be separated into an accent component (134), a phrase component (136), and a micro-prosody component (138) so that individual HMMs (140, 142, 144) can be learned. An F0 pattern is obtained by generating the accent component, the phrase component, and the micro-prosody component individually from the HMMs (140, 142, 144), and synthesizing the components using the results of text analysis.
(FR)
[Problème] L'invention a pour objet de réaliser un synthétiseur de motifs F0 en utilisant un modèle statistique au moyen duquel la corrélation entre des informations linguistiques et les motifs F0 devient claire tout en maintenant la précision. [Solution] Un dispositif d'apprentissage de HMM selon l'invention comprend: une unité d'estimation de paramètres qui représente un motif F0 (133) s'ajustant à un motif F0 continu (132) comme la somme d'une composante de phrase et d'une composante d'accent, et qui estime les points visés de ces composantes; et un moyen d'apprentissage de HMM destiné à apprendre un HMM (139) en utilisant le motif F0 comme données d'apprentissage après que le motif F0 s'est ajusté au motif F0 continu. Le motif F0 continu (132) peut être séparé en une composante (134) d'accent, une composante (136) de phrase et une composante (138) de micro-prosodie de telle façon que des HMM individuels (140, 142, 144) puissent être appris. Un motif F0 est obtenu en générant individuellement la composante d'accent, la composante de phrase, et la composante de micro-prosodie à partir des HMM (140, 142, 144), et en synthétisant les composantes à l'aide des résultats d'une analyse de texte.
(JA)
【課題】精度を保ちながら、言語学的情報とF0パターンとの対応が明確となるような、統計的モデルによるF0パターンの合成装置を提供する。 【解決手段】HMM学習装置は、連続F0パターン132にフィットするF0パターン133をフレーズ成分とアクセント成分との和として表し、それらのターゲットポイントを推定するパラメータ推定部と、フィット後のF0パターンを学習データとしてHMM139の学習を行なうHMM学習手段とを含む。連続F0パターン132をアクセント成分134、フレーズ成分136、及びマイクロ・プロソディ成分138に分離して個別のHMM140,142,及び144のHMMを学習してもよい。テキスト解析の結果を用いてアクセント成分、フレーズ成分、及びマイクロ・プロソディ成分を個別にHMM140,142及び144から生成し合成してF0パターンを得る。
他の公開
KR1020167001355
国際事務局に記録されている最新の書誌情報