処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2011132410 - アンカーモデル適応装置、集積回路、AV(Audio Video)デバイス、オンライン自己適応方法、およびそのプログラム

公開番号 WO/2011/132410
公開日 27.10.2011
国際出願番号 PCT/JP2011/002298
国際出願日 19.04.2011
IPC
G10L 25/57 2013.1
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
25G10L15/00~G10L21/00のグループ中のどれか一つに限定されない音声又は声の分析手法
48特定の用途に特に適合したもの
51比較または判別のためのもの
57動画像の処理のためのもの
CPC
G10L 2015/0631
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
063Training
0631Creating reference templates; Clustering
G10L 25/57
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
48specially adapted for particular use
51for comparison or discrimination
57for processing of video signals
出願人
  • パナソニック株式会社 PANASONIC CORPORATION [JP]/[JP] (AllExceptUS)
  • ジャー レイ JIA, Lei (UsOnly)
  • ザン ビンチー ZHANG, Bingqi (UsOnly)
  • シェン ハイフン SHEN, Haifeng (UsOnly)
  • マー ロン MA, Long (UsOnly)
  • 小沼 知浩 KONUMA, Tomohiro (UsOnly)
発明者
  • ジャー レイ JIA, Lei
  • ザン ビンチー ZHANG, Bingqi
  • シェン ハイフン SHEN, Haifeng
  • マー ロン MA, Long
  • 小沼 知浩 KONUMA, Tomohiro
代理人
  • 中島 司朗 NAKAJIMA, Shiro
優先権情報
201010155674.022.04.2010CN
公開言語 (言語コード) 日本語 (ja)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) ANCHOR MODEL ADAPTATION DEVICE, INTEGRATED CIRCUIT, AV (AUDIO VIDEO) DEVICE, ONLINE SELF-ADAPTATION METHOD, AND PROGRAM THEREFOR
(FR) DISPOSITIF D'ADAPTATION DE MODÈLE D'ANCRAGE, CIRCUIT INTÉGRÉ, DISPOSITIF AUDIO-VIDÉO, PROCÉDÉ D'AUTO-ADAPTATION EN LIGNE, ET PROGRAMME CORRESPONDANT
(JA) アンカーモデル適応装置、集積回路、AV(Audio Video)デバイス、オンライン自己適応方法、およびそのプログラム
要約
(EN) Disclosed is a device that sorts an AV stream by using the audio stream of the AV stream, wherein the device performs the online self-adaptation regulation of the anchor model for an acoustic space that is intended for use in said sorting. Also disclosed is a method therefor. Said device divides the input audio stream into partial data having identical audio features and estimates a single probability model for the divided partial data. In addition, the estimated single probability model is clustered with the single probability models for other audio features that have, thus far, been accumulated, and a new anchor model for the acoustic space is generated.
(FR) Cette invention concerne un dispositif qui trie un flux audio-vidéo au moyen du flux audio dudit flux audio-vidéo, le dispositif assurant une régulation d'auto-adaptation en ligne du modèle d'ancrage pour un espace acoustique qu'il est prévu d'utiliser pour ladite opération de tri, ainsi qu'un procédé correspondant. Ledit dispositif divise le flux audio d'entrée en données partielles présentant des caractéristiques audio identiques et estime un modèle de probabilité unique pour les données partielles divisées. De plus, le modèle unique de probabilité estimé est regroupé avec d'autres modèles de probabilité uniques pour d'autres caractéristiques audio qui se sont accumulées jusqu'ici, et un nouveau modèle d'ancrage est généré pour l'espace acoustique.
(JA)  AVストリームの分類等をAVストリームのオーディオ・ストリームを用いて実行する装置において、当該分類に使用するための、音響空間のアンカーモデルのオンライン自己適応調節を行う装置及びその方法を提供する。当該装置は、入力されたオーディオ・ストリームを同じ音響特徴を備える部分データに分割し、その分割された部分データの単一確率モデルを推定する。そして、推定した単一確率モデルと、それまでに蓄積された他の音響特徴の単一確率モデルとに対してクラスタリングを実行し、新たな音響空間のアンカーモデルを生成する。
国際事務局に記録されている最新の書誌情報