Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Goto Application

1. WO2020062900 - PROCÉDÉ, APPAREIL ET DISPOSITIF DE TRAITEMENT DU SON

Numéro de publication WO/2020/062900
Date de publication 02.04.2020
N° de la demande internationale PCT/CN2019/088302
Date du dépôt international 24.05.2019
CIB
G10L 25/78 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
25Techniques d'analyses de la parole ou de la voix qui ne se limitent pas à un seul des groupes G10L15/-G10L21/146
78Détection de la présence ou de l’absence de signaux de voix
CPC
G06K 9/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
G10L 21/02
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
21Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
02Speech enhancement, e.g. noise reduction or echo cancellation
G10L 21/0208
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
21Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
02Speech enhancement, e.g. noise reduction or echo cancellation
0208Noise filtering
G10L 21/0272
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
21Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
02Speech enhancement, e.g. noise reduction or echo cancellation
0272Voice signal separating
G10L 25/78
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00-G10L21/00
78Detection of presence or absence of voice signals
H04M 1/725
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
MTELEPHONIC COMMUNICATION
1Substation equipment, e.g. for use by subscribers; Analogous equipment at exchanges
72Substation extension arrangements; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selecting
725Cordless telephones
Déposants
  • 华为技术有限公司 HUAWEI TECHNOLOGIES CO., LTD. [CN]/[CN]
Inventeurs
  • 刘镇亿 LIU, Zhenyi
  • 赵文斌 ZHAO, Wenbin
  • 李峰 LI, Feng
Données relatives à la priorité
201811152007.X29.09.2018CN
Langue de publication chinois (ZH)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) SOUND PROCESSING METHOD, APPARATUS AND DEVICE
(FR) PROCÉDÉ, APPAREIL ET DISPOSITIF DE TRAITEMENT DU SON
(ZH) 一种声音处理方法、装置与设备
Abrégé
(EN)
Disclosed is a sound processing method, comprising: when a terminal records a video, if a current video frame includes human faces and the current audio frame has a voice (S21), determining a target human face in the current video frame (S22); acquiring a target distance between the target human face and the terminal (S23); determining a target gain according to the target distance, wherein the longer the target distance, the larger the target gain (S24); isolating a voice signal from a sound signal of the current audio frame (S25); and performing enhancement processing on the voice signal according to the target gain to obtain a target voice signal (S26). Self-adaptive enhancement of a human voice signal in a video recording process is realized.
(FR)
La présente invention concerne un procédé de traitement du son, consistant à : lorsqu'un terminal enregistre une vidéo, si une trame vidéo courante comprend des visages humains et que la trame audio courante comporte une voix (S21), déterminer un visage humain cible dans la trame vidéo courante (S22) ; acquérir une distance cible entre le visage humain cible et le terminal (S23) ; déterminer un gain cible selon la distance cible, plus la distance cible étant longue, plus le gain cible étant important (S24) ; isoler un signal vocal d'un signal sonore de la trame audio courante (S25) ; et réaliser un traitement d'amélioration sur le signal vocal selon le gain cible pour obtenir un signal vocal cible (S26). Une amélioration auto-adaptative d'un signal vocal humain dans un processus d'enregistrement vidéo est réalisée.
(ZH)
一种声音处理方法,终端录制视频时,当前视频帧包含人脸且当前音频帧存在语音时(S21),在当前视频帧中确定出目标人脸(S22);获取目标人脸与终端之间的目标距离(S23);根据目标距离确定出目标增益;目标距离越大,目标增益越大(S24);从当前音频帧的声音信号中分离出语音信号(S25);根据目标增益对语音信号进行增强处理,得到目标语音信号(S26)。实现录制视频过程中人声信号的自适应增强。
Également publié en tant que
Dernières données bibliographiques dont dispose le Bureau international