WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2004034379) METHODS AND DEVICES FOR SOURCE CONTROLLED VARIABLE BIT-RATE WIDEBAND SPEECH CODING
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2004/034379    International Application No.:    PCT/CA2003/001571
Publication Date: 22.04.2004 International Filing Date: 09.10.2003
Chapter 2 Demand Filed:    07.05.2004    
IPC:
G10L 11/04 (2006.01), G10L 19/02 (2006.01), G10L 19/14 (2006.01)
Applicants: NOKIA CORPORATION [FI/FI]; Keilalahdentie 4, FIN-02150 Espoo (FI) (For All Designated States Except US).
JELINEK, Milan [CA/CA]; (CA) (For US Only)
Inventors: JELINEK, Milan; (CA)
Agent: PERRY, Stephen, J.; Sim & McBurney, 330 University Avenue, 6th Floor, Toronto, M5G 1R7 (CA)
Priority Data:
60/417,667 11.10.2002 US
Title (EN) METHODS AND DEVICES FOR SOURCE CONTROLLED VARIABLE BIT-RATE WIDEBAND SPEECH CODING
(FR) PROCEDES ET DISPOSITIFS DE CODAGE VOCAL LARGE BANDE EN DEBIT BINAIRE VARIABLE COMMANDE PAR LA SOURCE
Abstract: front page image
(EN)Speech signal classification and encoding systems and methods are disclosed herein. The signal classification is done in three steps each of them discriminating a specific signal class. First, a voice activity detector (VAD) discriminates between active and inactive speech frames. If an inactive speech frame is detected (background noise signal) then the classification chain ends and the frame is encoded with comfort noise generation (CNG). If an active speech frame is detected, the frame is subjected to a second classifier dedicated to discriminate unvoiced frames. If the classifier classifies the frame as unvoiced speech signal, the classification chain ends, and the frame is encoded using a coding method optimized for unvoiced signals. Otherwise, the speech frame is passed through to the 'stable voiced' classification module. If the frame is classified as stable voiced frame, then the frame is encoded using a coding method optimized for stable voiced signals. Otherwise, the frame is likely to contain a non-stationary speech segment such as a voiced onset or rapidly evolving voiced speech signal. In this case a general-purpose speech coder is used at a high bit rate for sustaining good subjective quality .
(FR)La présente invention concerne des systèmes et procédés de classification et de codage du signal vocal. La classification du signal se fait en trois opérations dont chacune distingue une classe de signal spécifique. En premier lieu, un détecteur d'activité vocale ou VAD (Voice Activity Detector) distingue entre trames vocales actives et inactives. Si une trame vocale inactive est détectée (signal de bruit de fond), la chaîne de classification s'arrête, et le codage de la trame donne une génération de bruit de confort ou CNG (Comfort Noise Generation). Si une trame vocale active est détectée, cette trame est soumise à un deuxième classificateur spécialisé dans la distinction des trames non voisées. Si le classificateur classifie la trame comme signal vocal non voisé, la chaîne de classification s'arrête, et le codage de trame s'effectue au moyen d'un procédé de codage optimisé pour les signaux non voisés. Sinon, la trame vocale est prise en compte par le module de classification 'voisé stable'. Si la trame est classifiée trame voisée stable, son codage se fait au moyen d'un procédé de codage optimisé pour les signaux voisés stables. Autrement, la trame est susceptible de contenir un segment vocal non stationnaire tel que du signal vocal commençant à être voisé ou signal vocal voisé évoluant rapidement. Dans ce cas, on utilise un codeur vocal polyvalent à débit binaire élevé de façon à conserver une bonne qualité subjective.
Designated States: AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NI, NO, NZ, OM, PG, PH, PL, PT, RO, RU, SC, SD, SE, SG, SK, SL, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, YU, ZA, ZM, ZW.
African Regional Intellectual Property Organization (GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IT, LU, MC, NL, PT, RO, SE, SI, SK, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)