Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020003413 - DISPOSITIF DE TRAITEMENT D'INFORMATIONS, PROCÉDÉ DE COMMANDE ET PROGRAMME

Numéro de publication WO/2020/003413
Date de publication 02.01.2020
N° de la demande internationale PCT/JP2018/024391
Date du dépôt international 27.06.2018
CIB
G10L 17/00 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
17Identification ou vérification du locuteur
CPC
G10L 17/00
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17Speaker identification or verification
Déposants
  • 日本電気株式会社 NEC CORPORATION [JP]/[JP]
Inventeurs
  • カク レイ GUO Ling
  • 山本 仁 YAMAMOTO Hitoshi
  • 越仲 孝文 KOSHINAKA Takafumi
Mandataires
  • 速水 進治 HAYAMI Shinji
Données relatives à la priorité
Langue de publication japonais (JA)
Langue de dépôt japonais (JA)
États désignés
Titre
(EN) INFORMATION PROCESSING DEVICE, CONTROL METHOD, AND PROGRAM
(FR) DISPOSITIF DE TRAITEMENT D'INFORMATIONS, PROCÉDÉ DE COMMANDE ET PROGRAMME
(JA) 情報処理装置、制御方法、及びプログラム
Abrégé
(EN)
An information processing device (2000) calculates a first score indicating degree of similarity between input voice data (10) and registrant voice data (22) of a registrant (20). The information processing device (2000) divides the input voice data (10) in a time direction to thereby obtain a plurality of segment voice data (12). The information processing device (2000) calculates a second score indicating degree of similarity between the segment voice data (12) and the registrant voice data (22) with regard to each of the segment voice data (12). The information processing device 2000 performs first determination that determines whether a speaker of voice included in the input voice data (10) is one speaker or plural speakers by using at least the second score. The information processing device (2000) performs second determination that determines whether the input voice data (10) includes voice of the registrant (20) on the basis of the first score, the second score, and the result of the first determination.
(FR)
Dispositif de traitement d'informations (2000) calculant un premier score indiquant le degré de similarité entre des données vocales d'entrée (10) et des données vocales de d'inscrit (22) d'un inscrit (20). Le dispositif de traitement d'informations (2000) divise les données vocales d'entrée (10) dans une direction temporelle pour obtenir ainsi une pluralité de données vocales segmentées (12). Le dispositif de traitement d'informations (2000) calcule un second score indiquant le degré de similarité entre les données vocales segmentées (12) et les données vocales d'inscrit (22) par rapport à chacune des données vocales segmentées (12). Le dispositif de traitement d'informations (2000) effectue une première détermination qui détermine si un locuteur de voix comprise dans les données vocales d'entrée (10) est un locuteur ou plusieurs locuteurs à l'aide d'au moins le second score. Le dispositif de traitement d'informations (2000) effectue une seconde détermination qui détermine si les données vocales d'entrée (10) comprennent la voix de l'inscrit (20) sur la base du premier score, du second score, et du résultat de la première détermination.
(JA)
情報処理装置(2000)は、入力音声データ(10)と、登録者(20)の登録者音声データ(22)との類似度合いを表す第1スコアを算出する。情報処理装置(2000)は、入力音声データ(10)を時間方向に分割することで、複数のセグメント音声データ(12)を得る。情報処理装置(2000)は、各セグメント音声データ(12)について、セグメント音声データ(12)と登録者音声データ(22)との類似度合いを表す第2スコアを算出する。情報処理装置2000は、少なくとも第2スコアを用いて、入力音声データ(10)に含まれる音声の話者が、一人と複数のいずれであるかを判定する第1判定を行う。情報処理装置(2000)は、第1スコア、第2スコア、及び第1判定の結果に基づいて、入力音声データ(10)に登録者(20)の音声が含まれるか否かを判定する第2判定を行う。
Dernières données bibliographiques dont dispose le Bureau international