WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2015125567) SOUND SIGNAL PROCESSING DEVICE, SOUND SIGNAL PROCESSING METHOD, AND PROGRAM
Latest bibliographic data on file with the International Bureau   

Pub. No.: WO/2015/125567 International Application No.: PCT/JP2015/052124
Publication Date: 27.08.2015 International Filing Date: 27.01.2015
IPC:
G10L 15/04 (2013.01) ,G10L 25/51 (2013.01) ,G10L 25/78 (2013.01)
Applicants: SONY CORPORATION[JP/JP]; 1-7-1, Konan, Minato-Ku, Tokyo 1080075, JP
Inventors: HIROE, Atsuo; JP
Agent: MIYATA, Masaaki; JP
Priority Data:
2014-03104420.02.2014JP
Title (EN) SOUND SIGNAL PROCESSING DEVICE, SOUND SIGNAL PROCESSING METHOD, AND PROGRAM
(FR) DISPOSITIF DE TRAITEMENT DE SIGNAL SONORE, PROCÉDÉ DE TRAITEMENT DE SIGNAL SONORE ET PROGRAMME
(JA) 音信号処理装置、および音信号処理方法、並びにプログラム
Abstract: front page image
(EN) Provided are a device and method for determining speech intervals at a high degree of accuracy from a sound signal in which a plurality of sounds are mixed. In a configuration in which direction points indicative of a sound source direction of a sound signal are connected in the time direction and speech intervals are detected, pattern classification in accordance with a directivity property for the sound source direction is performed and a directivity pattern and a blind spot pattern are generated from the classification results. An average blind spot pattern, which is an average of a plurality of blind spot patterns at input timings of signals that are unlikely for speech, is calculated. Threshold values set somewhat lower than the average blind spot pattern are calculated as threshold values to be applied to minimum point detection of sound source direction correspondences from the blind spot patterns, and the minimum points of the threshold values or below are determined to be sound source direction correspondence points.
(FR) L'invention concerne un dispositif et un procédé de détermination d'intervalles de parole à haut degré de précision à partir d'un signal sonore dans lequel plusieurs sons sont mélangés. Dans une configuration dans laquelle des points de direction indiquant une direction de source sonore d'un signal sonore sont reliés dans la direction temporelle et des intervalles de parole sont détectés, une classification de formes selon une propriété de directivité pour la direction de source sonore est réalisée et une forme de directivité et une forme d'angle mort sont générées à partir des résultats de la classification. Une forme d'angle mort moyenne, qui représente la moyenne d'une pluralité de formes d'angle mort à des moments d'entrée de signaux qui sont peu susceptibles de correspondre à des paroles, est calculée. Des valeurs seuil définies de manière à être légèrement inférieures à la forme d'angle mort moyenne sont calculées en tant que valeurs seuil devant être appliquée à des correspondances de détection de point minimum de direction de source sonore à partir des formes d'angle mort, et les points minimum des valeurs seuil ou inférieures sont déterminés comme étant des points de correspondance de direction de source sonore.
(JA) 複数の音が混在した音信号から高精度に音声区間を判定する装置、方法を提供する。音信号の音源方向を示す方向点を時間方向に接続し、音声区間を検出する構成において、音源方向に対する指向特性に応じたパターン分類を行い、分類結果から指向性パターン、死角パターンを生成する。また、音声らしくない信号の入力タイミングにおける複数の死角パターンの平均である平均死角パターンを算出する。さらに、死角パターンからの音源方向対応の極小点検出に適用する閾値として、平均死角パターンよりやや低い値に設定された閾値を算出し、閾値以下の極小点を、音源方向対応点と判定する。
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Office (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Japanese (JA)
Filing Language: Japanese (JA)