Processing

Please wait...

Settings

Settings

Goto Application

1. WO2022024297 - VOICE PROCESSING DEVICE, VOICE PROCESSING METHOD, RECORDING MEDIUM, AND VOICE AUTHENTICATION SYSTEM

Publication Number WO/2022/024297
Publication Date 03.02.2022
International Application No. PCT/JP2020/029248
International Filing Date 30.07.2020
IPC
G10L 25/30 2013.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/-G10L21/129
27characterised by the analysis technique
30using neural networks
G10L 25/66 2013.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/-G10L21/129
48specially adapted for particular use
51for comparison or discrimination
66for extracting parameters related to health condition
CPC
G10L 25/30
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
27characterised by the analysis technique
30using neural networks
G10L 25/66
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
48specially adapted for particular use
51for comparison or discrimination
66for extracting parameters related to health condition
Applicants
  • 日本電気株式会社 NEC CORPORATION [JP]/[JP]
Inventors
  • カク レイ GUO Ling
  • 越仲 孝文 KOSHINAKA Takafumi
Agents
  • 北嶋 啓至 KITAJIMA Hiroshi
  • 机 昌彦 TSUKUE Masahiko
Priority Data
Publication Language Japanese (ja)
Filing Language Japanese (JA)
Designated States
Title
(EN) VOICE PROCESSING DEVICE, VOICE PROCESSING METHOD, RECORDING MEDIUM, AND VOICE AUTHENTICATION SYSTEM
(FR) DISPOSITIF DE TRAITEMENT VOCAL, PROCÉDÉ DE TRAITEMENT VOCAL ET SYSTÈME D'AUTHENTIFICATION VOCALE
(JA) 音声処理装置、音声処理方法、記録媒体、および音声認証システム
Abstract
(EN) The present invention provides a technology capable of easily determining the state of a person to be determined without requiring an interview with the person by a user or a biological sensor. A feature extraction unit (110) extracts, from input data based on an utterance of a person to be determined, the feature of the input data using a discriminator that has performed machine learning using, as training data, voice data based on an utterance of the person to be determined in a normal state. An index value calculation unit (120) calculates an index value indicating the degree of similarity between the feature of the input data and the feature of the voice data based on the utterance of the person to be determined in a normal state. A state determination unit (130) determines whether the person to be determined is in a normal state or in an abnormal state on the basis of the index value.
(FR) La présente invention concerne une technologie capable de déterminer facilement l'état d'une personne à déterminer sans nécessiter d'entretien avec la personne par un utilisateur ou un capteur biologique. Une unité d'extraction de caractéristiques (110) extrait, dans des données d'entrée basées sur un énoncé d'une personne à déterminer, la caractéristique des données d'entrée à l'aide d'un discriminateur qui a effectué un apprentissage automatique en utilisant, en tant que données d'apprentissage, des données vocales basées sur un énoncé de la personne à déterminer dans un état normal. Une unité de calcul de valeur d'indice (120) calcule une valeur d'indice indiquant le degré de similarité entre la caractéristique des données d'entrée et la caractéristique des données vocales sur la base de l'énoncé de la personne à déterminer dans un état normal. Une unité de détermination d'état (130) détermine si la personne à déterminer est dans un état normal ou dans un état anormal sur la base de la valeur d'indice.
(JA) ユーザによる判定の対象者との面談または生体センサの必要なしに、判定の対象者の状態を簡単に判定可能な技術を提供する。特徴抽出部(110)は、正常状態であったときの判定の対象者の発話に基づく音声データを教師データとして機械学習した識別器を用いて、判定の対象者の発話に基づく入力データから、入力データの特徴を抽出し、指標値算出部(120)は、入力データの特徴と、正常状態であったときの判定の対象者の発話に基づく音声データの特徴との間の類似度を表す指標値を算出し、状態判定部(130)は、指標値に基づいて、判定の対象者が正常状態であるか、非正常状態であるかを判定する。
Latest bibliographic data on file with the International Bureau