WIPO logo
Mobile | Deutsch | English | Español | Français | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

国際・国内特許データベース検索
World Intellectual Property Organization
検索
 
閲覧
 
翻訳
 
オプション
 
最新情報
 
ログイン
 
ヘルプ
 
自動翻訳
1. (WO2014125736) 音声認識装置、および音声認識方法、並びにプログラム
国際事務局に記録されている最新の書誌情報   

Translation翻訳: 原文 > 日本語
国際公開番号:    WO/2014/125736    国際出願番号:    PCT/JP2013/084202
国際公開日: 21.08.2014 国際出願日: 20.12.2013
IPC:
G10L 15/28 (2013.01), G10L 15/04 (2013.01), G10L 21/0272 (2013.01)
出願人: SONY CORPORATION [JP/JP]; 1-7-1, Konan, Minato-Ku, Tokyo 1080075 (JP)
発明者: HIROE, Atsuo; (JP)
代理人: MIYATA, Masaaki; Daido Patent Attorneys Partnership Corporation, KSK Bldg. West 8F, 3-25-9, Hatchobori, Chuo-Ku, Tokyo 1040032 (JP)
優先権情報:
2013-026551 14.02.2013 JP
発明の名称: (EN) SPEECH RECOGNITION DEVICE, SPEECH RECOGNITION METHOD AND PROGRAM
(FR) DISPOSITIF DE RECONNAISSANCE DE LA PAROLE, PROCÉDÉ DE RECONNAISSANCE DE LA PAROLE ET PROGRAMME
(JA) 音声認識装置、および音声認識方法、並びにプログラム
要約: front page image
(EN)Provided is a device and a method for quickly extracting a target sound from a sound signal in which a plurality of sounds are mixed. The device includes: a tracking section that detects a sound source direction and a speech segment, and executes sound source extraction processing; and a speech recognition section that inputs the sound source extraction result and executes speech recognition processing. The tracking section is configured so that: each of in-creation segment management parts that generate and manage speech segments of a sound source unit sequentially detects a sound source direction, and sequentially updates speech segments in which detection results are connected in a time direction; and at the same time, each of the in-creation segment management parts generates a filter for sound source extraction after a predetermined time passes from a speech segment start point, and applies the generated filter to input signals sequentially so that sound source extraction results are generated sequentially. The speech recognition section sequentially executes speech recognition processing with respect to a partial sound source extraction result, and outputs the speech recognition result.
(FR)L'invention porte sur un dispositif et un procédé servant à extraire rapidement un son cible d'un signal sonore dans lequel une pluralité de sons sont mélangés. Le dispositif comprend : une section de poursuite qui détecte une direction de source sonore et un segment de parole, et exécute un traitement d'extraction de source sonore ; et une section de reconnaissance de la parole qui reçoit en entrée le résultat d'extraction de source sonore et exécute un traitement de reconnaissance de la parole. La section de poursuite est configurée de manière que : chaque partie parmi des parties de gestion de segment en création qui génèrent et gèrent des segments de parole d'une unité de source sonore détecte séquentiellement une direction de source sonore, et met à jour séquentiellement des segments de parole dans lesquels des résultats de détection sont reliés dans une direction temporelle ; et en même temps, chacune des parties de gestion de segment en création génère un filtre pour extraction de source sonore après qu'un temps prédéterminé s'est écoulé depuis un point de début de segment de parole, et applique le filtre généré à des signaux d'entrée séquentiellement pour que des résultats d'extraction de source sonore soient générés séquentiellement. La section de reconnaissance de la parole exécute séquentiellement un traitement de reconnaissance de la parole relativement à un résultat d'extraction de source sonore partiel, et délivre le résultat de reconnaissance de la parole.
(JA)複数の音が混在した音信号から、迅速に目的音を抽出する装置、方法を提供する。音源方向と音声区間を検出し、音源抽出処理を実行するトラッキング部と、音源抽出結果を入力して音声認識処理を実行する音声認識部を有する。トラッキング部は、音源単位の音声区間の生成管理を行なう作成中区間管理部各々が音源方向の逐次的検出を行い、検出結果を時間方向に接続した音声区間を順次更新するとともに、音声区間始端から所定時間経過後に音源抽出用のフィルタを生成し、生成フィルタを逐次的に入力信号に適用して音源抽出結果を逐次的に生成する。音声認識部は、部分的な音源抽出結果に対する音声認識処理を逐次的に実行して、音声認識結果を出力する。
指定国: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
アフリカ広域知的所有権機関(ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
ユーラシア特許庁(EAPO) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
欧州特許庁(EPO) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
アフリカ知的所有権機関(OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
国際公開言語: Japanese (JA)
国際出願言語: Japanese (JA)