WIPO logo
Mobile | Deutsch | English | Español | Français | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

国際・国内特許データベース検索
World Intellectual Property Organization
検索
 
閲覧
 
翻訳
 
オプション
 
最新情報
 
ログイン
 
ヘルプ
 
自動翻訳
1. (WO2008069308) 音声認識装置および音声認識方法
国際事務局に記録されている最新の書誌情報   

Translation翻訳: 原文 > 日本語
国際公開番号:    WO/2008/069308    国際出願番号:    PCT/JP2007/073674
国際公開日: 12.06.2008 国際出願日: 07.12.2007
予備審査請求日:    29.07.2008    
IPC:
G10L 15/06 (2006.01), G10L 15/04 (2006.01), G10L 15/18 (2006.01)
出願人: NEC CORPORATION [JP/JP]; 7-1, Shiba 5-chome, Minato-ku, Tokyo 1080014 (JP) (米国を除く全ての指定国).
EMORI, Tadashi [JP/JP]; (JP) (米国のみ).
ONISHI, Yoshifumi [JP/JP]; (JP) (米国のみ)
発明者: EMORI, Tadashi; (JP).
ONISHI, Yoshifumi; (JP)
代理人: YAMASHITA, Johei; YAMASHITA & ASSOCIATES, Toranomon 40th MT Bldg., 13-1, Toranomon 5-chome, Minato-ku, Tokyo 1050001 (JP)
優先権情報:
2006-331871 08.12.2006 JP
発明の名称: (EN) AUDIO RECOGNITION DEVICE AND AUDIO RECOGNITION METHOD
(FR) DISPOSITIF DE RECONNAISSANCE AUDIO ET PROCÉDÉ DE RECONNAISSANCE AUDIO
(JA) 音声認識装置および音声認識方法
要約: front page image
(EN)It is possible to learn an acoustic model and a language model for each of vocalized lengths indicating a vocalized section in audio data and perform voice recognition by using the acoustic model and the language model. A voice recognition device includes means (103) which detects a vocalized section in audio data (101) and generates section information indicating the vocalized section; means (104) which recognizes the data portion corresponding to the section information in audio data and text data (102) acquired from the audio data and classifying the data portion according to the vocalized length; and means (106) which learns an acoustic model and a language model (107) by using the classified data portion (105).
(FR)Il est possible d'apprendre un modèle acoustique et un modèle de langage pour chacune des longueurs vocalisées indiquant une section vocalisée dans des données audio, et d'effectuer une reconnaissance vocale en utilisant le modèle acoustique et le modèle de langage. Un dispositif de reconnaissance vocale comprend des moyens (103) qui détectent une section vocalisée dans des données audio (101) et qui génèrent des informations de section indiquant la section vocalisée ; des moyens (104) qui reconnaissent la partie de données correspondant aux informations de section dans les données audio et les données de texte (102) acquises à partir des données audio et qui classifient la partie de données selon la longueur vocalisée ; et des moyens (106) qui apprennent un modèle acoustique et un modèle de langage (107) en utilisant la partie de données classifiée (105).
(JA) 音声データにおける発声区間の長さを表す発声長別に音響モデルおよび言語モデルを学習し、それら音響モデルおよび言語モデルを用いて音声認識処理を行う。音声認識装置は、音声データ(101)における発声区間を検出し該発声区間を表す区間情報を生成する手段(103)と、音声データと該音声データから書き起こされたテキストデータ(102)とにおける区間情報に対応するデータ部分を認識し該データ部分をその発声長に基づき分類する手段(104)と、分類されたデータ部分(105)を用いて音響モデルおよび言語モデル(107)を学習する手段(106)とを有する。
指定国: AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, SV, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
アフリカ広域知的所有権機関(ARIPO) (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
ユーラシア特許庁(EAPO) (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
欧州特許庁(EPO) (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IS, IT, LT, LU, LV, MC, MT, NL, PL, PT, RO, SE, SI, SK, TR)
アフリカ知的所有権機関(OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
国際公開言語: Japanese (JA)
国際出願言語: Japanese (JA)