処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2010114123 - 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム

公開番号 WO/2010/114123
公開日 07.10.2010
国際出願番号 PCT/JP2010/056077
国際出願日 02.04.2010
IPC
G10L 21/02 2006.01
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
21他の可聴信号,または不可聴信号への音声信号変換処理,例.特性や明瞭性を修正するための視覚,触覚
02音声の強調,例.雑音低減またはエコー除去
G10L 19/02 2006.01
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
19冗長を減らすための音声または音響信号の分析合成技術,例.ボコーダにおける;音声または音響信号のコード化またはデコード化,ソースフィルタモデルまたは心理音響分析を用いるもの
02スペクトル分析を用いるもの,例.変換ボコーダまたはサブバンドボコーダ
CPC
G10L 19/00
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
19Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
G10L 19/0208
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
19Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
02using spectral analysis, e.g. transform vocoders or subband vocoders
0204using subband decomposition
0208Subband vocoders
G10L 19/0212
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
19Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
02using spectral analysis, e.g. transform vocoders or subband vocoders
0212using orthogonal transformation
G10L 19/03
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
19Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
02using spectral analysis, e.g. transform vocoders or subband vocoders
03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
G10L 19/06
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
19Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
04using predictive techniques
06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
G10L 19/167
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
19Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
04using predictive techniques
16Vocoder architecture
167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
出願人
  • 株式会社エヌ・ティ・ティ・ドコモ NTT DoCoMo, Inc. [JP]/[JP] (AllExceptUS)
  • 辻野 孝輔 TSUJINO, Kosuke [JP]/[JP] (UsOnly)
  • 菊入 圭 KIKUIRI, Kei [JP]/[JP] (UsOnly)
  • 仲 信彦 NAKA, Nobuhiko [JP]/[JP] (UsOnly)
発明者
  • 辻野 孝輔 TSUJINO, Kosuke
  • 菊入 圭 KIKUIRI, Kei
  • 仲 信彦 NAKA, Nobuhiko
代理人
  • 長谷川 芳樹 HASEGAWA, Yoshiki
優先権情報
2009-09139603.04.2009JP
2009-14683119.06.2009JP
2009-16223808.07.2009JP
2010-00441912.01.2010JP
公開言語 (言語コード) 日本語 (JA)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) SPEECH ENCODING DEVICE, SPEECH DECODING DEVICE, SPEECH ENCODING METHOD, SPEECH DECODING METHOD, SPEECH ENCODING PROGRAM, AND SPEECH DECODING PROGRAM
(FR) DISPOSITIF DE CODAGE DE PAROLE, DISPOSITIF DE DÉCODAGE DE PAROLE, PROCÉDÉ DE CODAGE DE PAROLE, PROCÉDÉ DE DÉCODAGE DE PAROLE, PROGRAMME DE CODAGE DE PAROLE ET PROGRAMME DE DÉCODAGE DE PAROLE
(JA) 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム
要約
(EN)
With respect to a signal represented in a frequency domain, a linear prediction analysis is performed in the frequency direction according to a covariance method or an autocorrelation method to obtain a linear prediction coefficient, filter strength is adjusted to the linear prediction coefficient obtained, and then the time envelope of the signal is transformed by filtering the signal in the frequency direction with the coefficient after adjustment. Thus, in a band extension technique in the frequency domain represented by SBR, pre-echo/post-echo which may occur is reduced without a significant increase in bit rate, whereby the subjective quality of a decoding signal can be improved.
(FR)
Selon l'invention, en rapport avec un signal représenté dans un domaine fréquentiel, une analyse de prédiction linéaire est réalisée dans le sens de la fréquence selon un procédé de covariance ou un procédé d'auto corrélation, de sorte à obtenir un coefficient de prédiction linéaire. Selon l'invention également, la résistance d'un filtre est ajustée par rapport au coefficient de prédiction linéaire obtenu, et l'enveloppe temporelle du signal est ensuite transformée en filtrant le signal dans le sens de la fréquence avec le coefficient après ajustement. Dans ces conditions, dans un procédé d'extension de bande dans le domaine fréquentiel représenté par SBR, un pré-écho ou un post-écho qui sont susceptibles de se produire, sont réduits sans augmentation significative du débit binaire, ce qui permet ainsi d'améliorer la qualité subjective d'un signal de décodage.
(JA)
 周波数領域で表現された信号に対し、共分散法または自己相関法によって周波数方向に線形予測分析を行って線形予測係数を求め、さらに求められた線形予測係数に対しフィルタ強度の調整を行った後、調整後の係数により信号を周波数方向にフィルタ処理することにより、信号の時間エンベロープを変形する。これにより、SBRに代表される周波数領域での帯域拡張技術において、ビットレートを著しく増大させることなく、発生するプリエコー・ポストエコーを軽減し復号信号の主観的品質を向上させる。
国際事務局に記録されている最新の書誌情報