Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. KR1020200063984 - 음성 인식 장치 및 방법

Office République de Corée
Numéro de la demande 1020190150494
Date de la demande 21.11.2019
Numéro de publication 1020200063984
Date de publication 05.06.2020
Type de publication A
CIB
G10L 25/75
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
25Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes G10L15/-G10L21/146
75pour la modélisation des paramètres du conduit vocal
G10L 15/06
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
06Création de gabarits de référence; Entraînement des systèmes de reconnaissance de la parole, p.ex. adaptation aux caractéristiques de la voix du locuteur
CPC
G10L 25/75
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00-G10L21/00
75for modelling vocal tract parameters
G10L 15/063
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
063Training
Déposants 삼성전자주식회사
Inventeurs 김찬우
고다다 난자야 엔.
김성수
신민규
래리 폴 헥
가르그 아비나브
김광윤
쿠마르 메훌
Mandataires 리앤목특허법인
Données relatives à la priorité 1020190036376 28.03.2019 KR
62/772,382 28.11.2018 US
62/848,698 16.05.2019 US
Titre
(KO) 음성 인식 장치 및 방법
Abrégé
(KO)
본 개시는 사용자 음성을 인식하는 전자 장치 및 상기 전자 장치가 사용자 음성을 인식하는 방법에 관한 것이다. 일 실시 예에 의하면, 사용자의 음성을 인식하는 방법은 복수의 프레임 단위로 구분되는 오디오 신호를 획득하는 단계; 상기 프레임 단위로 구분되는 상기 오디오 신호의 주파수 스펙트럼에 기 설정된 스케일에 따라 분포된 필터 뱅크를 적용함으로써 필터 뱅크 별 에너지 성분을 결정하는 단계; 상기 결정된 필터 뱅크 별 에너지 성분을 평탄화(smoothing) 하는 단계; 상기 평탄화된 필터 뱅크 별 에너지 성분에 기초하여 상기 오디오 신호의 특징 벡터를 추출하는 단계; 및 상기 추출된 특징 벡터를 음성 인식 모델에 입력함으로써 상기 오디오 신호 내 상기 사용자의 음성을 인식하는 단계; 를 포함할 수 있다.

Également publié en tant que