Processing

Please wait...

Settings

Settings

Goto Application

1. WO2022007846 - SPEECH ENHANCEMENT METHOD, DEVICE, SYSTEM, AND STORAGE MEDIUM

Publication Number WO/2022/007846
Publication Date 13.01.2022
International Application No. PCT/CN2021/105003
International Filing Date 07.07.2021
IPC
G10L 17/00 2013.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17Speaker identification or verification
G10L 17/02 2013.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17Speaker identification or verification
02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis or principal components; Feature selection or extraction
G10L 13/02 2013.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
13Speech synthesis; Text to speech systems
02Methods for producing synthetic speech; Speech synthesisers
G10L 17/20 2013.1
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17Speaker identification or verification
20Pattern transformations or operations aimed at increasing system robustness, e.g. against channel noise or different working conditions
Applicants
  • 华为技术有限公司 HUAWEI TECHNOLOGIES CO., LTD. [CN]/[CN]
Inventors
  • 胡伟湘 HU, Weixiang
  • 黄劲文 HUANG, Jinwen
  • 曾夕娟 ZENG, Xijuan
  • 芦宇 LU, Yu
Agents
  • 上海音科专利商标代理有限公司 YINKE PATENT & TRADEMARK AGENT (SHANGHAI) LTD.
Priority Data
202010650893.X08.07.2020CN
Publication Language Chinese (zh)
Filing Language Chinese (ZH)
Designated States
Title
(EN) SPEECH ENHANCEMENT METHOD, DEVICE, SYSTEM, AND STORAGE MEDIUM
(FR) PROCÉDÉ D'AMÉLIORATION DE LA QUALITÉ DE LA PAROLE, DISPOSITIF, SYSTÈME ET SUPPORT DE STOCKAGE
(ZH) 语音增强方法、设备、系统以及存储介质
Abstract
(EN) The present application provides an artificial intelligence (AI)-based speech enhancement method, a terminal device, a speech enhancement system, and a computer readable storage medium. An electronic device acquires speech to be verified; the electronic device determines at least one of environmental noise and an environment feature parameter comprised in the speech to be verified; the electronic device then enhances a registration speech on the basis of the environmental noise and/or the environment feature parameter; finally, the electronic device compares the speech to be verified with the enhanced registration speech to determine whether the speech to be verified and the registration speech are from the same user. In embodiments of the present application, the registration speech is enhanced according to a noise component in the speech to be verified so as to cause the enhanced registration speech and the speech to be verified to have similar noise components, so that a more accurate recognition result can be obtained.
(FR) La présente invention concerne un procédé d'amélioration de la qualité de la parole fondé sur l'intelligence artificielle (IA), un dispositif terminal, un système d'amélioration de la qualité de la parole et un support de stockage lisible par ordinateur. Un dispositif électronique acquiert la parole à vérifier ; le dispositif électronique détermine le bruit environnemental et/ou un paramètre de caractéristiques de l'environnement compris dans la parole à vérifier ; le dispositif électronique améliore ensuite la qualité d'une parole d'enregistrement sur la base du bruit environnemental et/ou du paramètre de caractéristiques de l'environnement ; finalement, le dispositif électronique compare la parole à vérifier avec la parole d'enregistrement améliorée pour déterminer si la parole à vérifier et la parole d'enregistrement appartiennent au même utilisateur. Dans des modes de réalisation de la présente invention, la qualité de la parole d'enregistrement est améliorée en fonction d'une composante de bruit dans la parole à vérifier, de façon à faire en sorte que la parole d'enregistrement améliorée et la parole à vérifier présentent des composantes de bruit similaires, de sorte qu'un résultat de reconnaissance plus précis puisse être obtenu.
(ZH) 本申请的提供了一种基于人工智能(Artificial Intelligence,AI)语音增强方法、终端设备、语音增强系统以及计算机可读存储介质。电子设备采集待验证语音,电子设备确定待验证语音中包含的环境噪声、环境特征参数中的至少一项,电子设备再基于环境噪声和/或环境特征参数对注册语音进行增强。最后,电子设备比较待验证语音与增强的注册语音,以确定待验证语音和注册语音是否来自相同用户。本申请实施方式中,根据待验证语音中的噪声成分对注册语音进行增强,以使得增强的注册语音和待验证语音具有相接近的噪声成分,从而可以得到更准确的识别结果。
Latest bibliographic data on file with the International Bureau