処理中

しばらくお待ちください...

設定

設定

出願の表示

1. WO2020250828 - 発話区間検出装置、発話区間検出方法、および発話区間検出プログラム

公開番号 WO/2020/250828
公開日 17.12.2020
国際出願番号 PCT/JP2020/022334
国際出願日 05.06.2020
IPC
G10L 25/84 2013.1
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
25G10L15/00~G10L21/00のグループ中のどれか一つに限定されない音声又は声の分析手法
78音声の信号の有無の検出
84雑音と音声を判別するためのもの
G10L 15/04 2013.1
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
15音声認識
04セグメンテーション;語句境界検出
G10L 25/75 2013.1
G物理学
10楽器;音響
L音声の分析または合成;音声認識;音声処理;音声または音響の符号化と復号化
25G10L15/00~G10L21/00のグループ中のどれか一つに限定されない音声又は声の分析手法
75声道パラメータをモデル化するためのもの
G06T 7/00 2017.1
G物理学
06計算;計数
Tイメージデータ処理または発生一般
7イメージ分析
G06T 7/62 2017.1
G物理学
06計算;計数
Tイメージデータ処理または発生一般
7イメージ分析
60幾何学的属性の分析
62面積,周囲長,直径または体積の分析
CPC
G06T 7/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
7Image analysis
G06T 7/62
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
7Image analysis
60Analysis of geometric attributes
62of area, perimeter, diameter or volume
G10L 15/04
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
04Segmentation; Word boundary detection
G10L 25/75
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
75for modelling vocal tract parameters
G10L 25/84
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
78Detection of presence or absence of voice signals
84for discriminating voice from noise
出願人
  • パナソニックIPマネジメント株式会社 PANASONIC INTELLECTUAL PROPERTY MANAGEMENT CO., LTD. [JP]/[JP]
発明者
  • 廣瀬 良文 HIROSE, Yoshifumi
代理人
  • 山尾 憲人 YAMAO, Norihito
  • 岡部 博史 OKABE, Hiroshi
優先権情報
2019-10891011.06.2019JP
公開言語 (言語コード) 日本語 (ja)
出願言語 (言語コード) 日本語 (JA)
指定国 (国コード)
発明の名称
(EN) UTTERANCE SECTION DETECTION DEVICE, UTTERANCE SECTION DETECTION METHOD, AND UTTERANCE SECTION DETECTION PROGRAM
(FR) DISPOSITIF DE DÉTECTION DE SECTION D'ÉNONCÉ, PROCÉDÉ DE DÉTECTION DE SECTION D'ÉNONCÉ ET PROGRAMME DE DÉTECTION DE SECTION D'ÉNONCÉ
(JA) 発話区間検出装置、発話区間検出方法、および発話区間検出プログラム
要約
(EN) This utterance section detection device includes: a first lip shape estimation unit which estimates a first lip shape of an utterer on the basis of acoustic data including the voice of the utterer; a second lip shape estimation unit which estimates a second lip shape of the utterer on the basis of image data in which the face of the utterer is at least photographed; and an utterance section detection unit which detects, on the basis of a change in the first lip shape and a change in the second lip shape, an utterance section in which the utterer utters a voice in the acoustic data.
(FR) La présente invention concerne un dispositif de détection de section d'énoncé comprenant : une première unité d'estimation de forme de lèvre qui estime une première forme de lèvre d'un locuteur sur la base de données acoustiques comprenant la voix du locuteur ; une seconde unité d'estimation de forme de lèvre qui estime une seconde forme de lèvre du locuteur sur la base de données d'images dans lesquelles le visage du locuteur est au moins photographié ; et une unité de détection de section d'énoncé qui détecte, sur la base d'un changement de la première forme de lèvre et d'un changement de la seconde forme de lèvre, une section d'énoncé dans laquelle le locuteur prononce des paroles dans les données acoustiques.
(JA) 発話区間検出装置は、発話者の音声を含む音響データに基づいて発話者の第1の口唇形状を推定する第1の口唇形状推定部と、発話者の顔が少なくとも写る画像データに基づいて発話者の第2の口唇形状を推定する第2の口唇形状推定部と、第1の口唇形状の変化と前記第2の口唇形状の変化に基づいて音響データにおいて発話者が音声を発声している発話区間を検出する発話区間検出部と、を含んでいる。
国際事務局に記録されている最新の書誌情報