Processing

Please wait...

Settings

Settings

1. WO2018106971 - SYSTEM AND METHOD FOR NEURAL NETWORK BASED SPEAKER CLASSIFICATION

Publication Number WO/2018/106971
Publication Date 14.06.2018
International Application No. PCT/US2017/065196
International Filing Date 07.12.2017
IPC
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17
Speaker identification or verification
18
Artificial neural networks; Connectionist approaches
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17
Speaker identification or verification
06
Decision making techniques; Pattern matching strategies
12
Score normalisation
G PHYSICS
10
MUSICAL INSTRUMENTS; ACOUSTICS
L
SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17
Speaker identification or verification
16
Hidden Markov models [HMMs]
G10L 17/18 (2013.01)
G10L 17/12 (2013.01)
G10L 17/16 (2013.01)
CPC
G10L 17/00
G10L 17/04
G10L 17/18
G10L 2025/937
G10L 25/45
Applicants
  • INTERACTIVE INTELLIGENCE GROUP, INC. [US/US]; 7601 Interactive Way Indianapolis, IN 46278, US
Inventors
  • GE, Zhenhao; US
  • IYER, Ananth, N.; US
  • CHELVARAJA, Srinath; US
  • SUNDARAM, Ram; GB
  • GANAPATHIRAJU, Aravind; US
Agents
  • LEE, Shaun, P.; US
Priority Data
62/431,12007.12.2016US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) SYSTEM AND METHOD FOR NEURAL NETWORK BASED SPEAKER CLASSIFICATION
(FR) SYSTÈME ET PROCÉDÉ DE CLASSIFICATION DE LOCUTEUR À BASE DE RÉSEAU NEURONAL
Abstract
(EN)
A method for classifying speakers includes: receiving, by a speaker recognition system including a processor and memory, input audio including speech from a speaker; extracting, by the speaker recognition system, a plurality of speech frames containing voiced speech from the input audio; computing, by the speaker recognition system, a plurality of features for each of the speech frames of the input audio; computing, by the speaker recognition system, a plurality of recognition scores for the plurality of features; computing, by the speaker recognition system, a speaker classification result in accordance with the recognition scores; and outputting, by the speaker recognition system, the speaker classification result.
(FR)
La présente invention concerne un procédé de classification de locuteurs qui comprend : la réception, par un système de reconnaissance de locuteur comprenant un processeur et une mémoire, d’une entrée audio comprenant une parole d’un locuteur ; l’extraction, par le système de reconnaissance de locuteur, d’une pluralité de trames de parole contenant de la parole vocale à partir de l’entrée audio ; le calcul, par le système de reconnaissance de locuteur, d’une pluralité de caractéristiques pour chacune des trames de parole de l’entrée audio ; le calcul, par le système de reconnaissance de locuteur, d’une pluralité de scores de reconnaissance pour la pluralité de caractéristiques ; le calcul, par le système de reconnaissance de locuteur, d’un résultat de classification de locuteur en fonction des scores de reconnaissance ; et la transmission, par le système de reconnaissance de locuteur, du résultat de classification de locuteur.
Latest bibliographic data on file with the International Bureau