Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2023273063 - PROCÉDÉ ET APPAREIL DE DÉTECTION DE PAROLE DE PASSAGER, DISPOSITIF ÉLECTRONIQUE ET SUPPORT DE STOCKAGE

Numéro de publication WO/2023/273063
Date de publication 05.01.2023
N° de la demande internationale PCT/CN2021/127096
Date du dépôt international 28.10.2021
CIB
G10L 15/22 2006.1
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15Reconnaissance de la parole
22Procédures utilisées pendant le processus de reconnaissance de la parole, p.ex. dialogue homme-machine 
CPC
G06F 18/253
G10L 15/02
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
02Feature extraction for speech recognition; Selection of recognition unit
G10L 15/22
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
22Procedures used during a speech recognition process, e.g. man-machine dialogue
G10L 15/25
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
24Speech recognition using non-acoustical features
25using position of the lips, movement of the lips or face analysis
G10L 2015/223
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
15Speech recognition
22Procedures used during a speech recognition process, e.g. man-machine dialogue
223Execution procedure of a spoken command
Déposants
  • 上海商汤临港智能科技有限公司 SHANGHAI SENSETIME LINGANG INTELLIGENT TECHNOLOGY CO., LTD. [CN]/[CN]
Inventeurs
  • 王飞 WANG, Fei
  • 钱晨 QIAN, Chen
Mandataires
  • 北京林达刘知识产权代理事务所(普通合伙) LINDA LIU & PARTNERS
Données relatives à la priorité
202110738677.530.06.2021CN
Langue de publication Chinois (zh)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) PASSENGER SPEAKING DETECTION METHOD AND APPARATUS, AND ELECTRONIC DEVICE AND STORAGE MEDIUM
(FR) PROCÉDÉ ET APPAREIL DE DÉTECTION DE PAROLE DE PASSAGER, DISPOSITIF ÉLECTRONIQUE ET SUPPORT DE STOCKAGE
(ZH) 乘员说话检测方法及装置、电子设备和存储介质
Abrégé
(EN) A passenger speaking detection method and apparatus, and an electronic device and a storage medium. The method comprises: acquiring a video stream and a sound signal in a vehicle cabin (S11); performing facial detection on the video stream, and determining a facial area, in the video stream, of at least one passenger in the vehicle cabin (S12); and according to the facial area of the at least one passenger and the sound signal, determining a target passenger in the vehicle cabin that produces the sound signal (S13).
(FR) L'invention concerne un procédé et un appareil de détection de parole de passager, ainsi qu'un dispositif électronique et un support de stockage. Le procédé comprend les étapes consistant à : acquérir un flux vidéo et un signal sonore dans une cabine de véhicule (S11) ; effectuer une détection faciale sur le flux vidéo et déterminer une zone faciale, dans le flux vidéo, d'au moins un passager dans la cabine de véhicule (S12) ; et en fonction de la zone faciale dudit au moins un passager et du signal sonore, déterminer un passager cible dans la cabine de véhicule qui produit le signal sonore (S13).
(ZH) 一种乘员说话检测方法及装置、电子设备和存储介质,该方法包括:获取车舱内的视频流和声音信号(S11);对视频流进行人脸检测,确定车舱内的至少一个乘员在视频流中的人脸区域(S12);根据至少一个乘员的人脸区域,以及声音信号,确定所述车舱内发出所述声音信号的目标乘员(S13)。
Documents de brevet associés
Dernières données bibliographiques dont dispose le Bureau international