Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2004010416 - PROCEDE ET DISPOSITIF DE CONVERSION ENTRE METHODES DE CODAGE ET DECODAGE VOCAL, ET LEUR PROCEDE DE STOCKAGE

Numéro de publication WO/2004/010416
Date de publication 29.01.2004
N° de la demande internationale PCT/JP2003/008701
Date du dépôt international 09.07.2003
Demande présentée en vertu du Chapitre 2 09.07.2003
CIB
G10L 19/08 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
19Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique
04utilisant des techniques de prédiction
08Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme
G10L 19/12 2006.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
19Techniques d'analyse ou de synthèse de la parole ou des signaux audio pour la réduction de la redondance, p.ex. dans les vocodeurs; Codage ou décodage de la parole ou des signaux audio utilisant les modèles source-filtre ou l’analyse psychoacoustique
04utilisant des techniques de prédiction
08Détermination ou codage de la fonction d'excitation; Détermination ou codage des paramètres de prédiction à long terme
12la fonction d’excitation étant l’excitation codée, p.ex. dans les vocodeurs à prédiction linéaire excités par code
CPC
G10L 19/083
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
19Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
04using predictive techniques
08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
083the excitation function being an excitation gain
G10L 19/12
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
19Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
04using predictive techniques
08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
12the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Déposants
  • NEC CORPORATION [JP]/[JP] (AllExceptUS)
  • MURASHIMA, Atsushi [JP]/[JP] (UsOnly)
Inventeurs
  • MURASHIMA, Atsushi
Mandataires
  • KATO, Asamichi
Données relatives à la priorité
2002-21576624.07.2002JP
Langue de publication japonais (JA)
Langue de dépôt japonais (JA)
États désignés
Titre
(EN) METHOD AND DEVICE FOR CODE CONVERSION BETWEEN VOICE ENCODING AND DECODING METHODS AND STORAGE MEDIUM THEREOF
(FR) PROCEDE ET DISPOSITIF DE CONVERSION ENTRE METHODES DE CODAGE ET DECODAGE VOCAL, ET LEUR PROCEDE DE STOCKAGE
(JA) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
Abrégé
(EN)
A code conversion device for converting a first code string based on a first method into a second code string based on a second method. An voice decoding circuit (1500) acquires information of a first linear prediction coefficient and an excitation signal from the first code string and drives a filter having the first linear prediction coefficient by an excitation signal obtained from the excitation signal information, thereby generating a first voice signal. A gain code generation circuit (1400) calculates a gain (optimal gain) at which the distance between a second voice signal generated by information obtained from the second code string and the first voice signal is minimum and corrects the optimal gain, so that gain information in the second code string is obtained according to the optimal gain which has been corrected (corrected optimal gain), the aforementioned optimal gain, and a gain read out from a gain codebook in the second method. Here, according to a voice judgment value, at a non-voice section, a gain is obtained by using an evaluation function which reduces the gain time fluctuation of the second code string.
(FR)
L'invention porte sur un dispositif de conversion d'une première chaîne de code basée sur une première méthode en une deuxième chaîne de code basée sur une deuxième méthode, selon lequel un circuit de décodage de la voix acquiert des informations sur un premier coefficient linéaire de prédiction et un signal d'excitation à partir de la première chaîne de codage, et commande un filtre présentant le premier coefficient linéaire de prédiction à l'aide d'un signal d'excitation obtenu de l'information du signal d'excitation, ce qui produit un premier signal vocal. Un circuit générateur (1400) de code de gain calcule le gain optimal pour lequel la distance entre un deuxième signal vocal produit par des informations obtenues de la deuxième chaîne de code, et le premier signal vocal est minimal, et corrige le gain optimal si bien que l'information de gain de la deuxième chaîne de code est obtenue en fonction: du gain optimal corrigé, du susdit gain optimal et du gain lu dans la table de codes de la deuxième méthode. Ainsi, en fonction d'une valeur d'évaluation de la voix on obtient un gain en utilisant une fonction d'évaluation qui réduit les fluctuations du gain dans le temps de la deuxième chaîne de code.
(JA)
 第1の方式に準拠する第1の符号列を、第2の方式に準拠する第2の符号列へ変換する符号変換装置において、音声復号回路(1500)は、前記第1の符号列から第1の線形予測係数と励振信号の情報を得て、前記第1の線形予測係数をもつフィルタを前記励振信号の情報から得られる励振信号で駆動することによって第1の音声信号を生成し、ゲイン符号生成回路(1400)は、第2の符号列から得られる情報により生成される第2の音声信号と、前記第1の音声信号との距離が最小となるゲイン(最適ゲイン)を計算し、前記最適ゲインを修正し、修正された最適ゲイン(修正最適ゲイン)と、前記最適ゲインと、第2の方式におけるゲインコードブックから読み出されるゲインとに基づき、第2の符号列におけるゲイン情報を求める。その際、音声判別値に基づき、非音声区間において、第2の符号列のゲインの時間変動が小さくなるような評価関数を用いて、ゲインを求める。
Dernières données bibliographiques dont dispose le Bureau international