Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020154916 - PROCÉDÉ ET APPAREIL DE SYNTHÈSE DE SOUS-TITRES VIDÉO, SUPPORT DE STOCKAGE ET DISPOSITIF ÉLECTRONIQUE

Numéro de publication WO/2020/154916
Date de publication 06.08.2020
N° de la demande internationale PCT/CN2019/073770
Date du dépôt international 29.01.2019
CIB
H04N 5/278 2006.01
HÉLECTRICITÉ
04TECHNIQUE DE LA COMMUNICATION ÉLECTRIQUE
NTRANSMISSION D'IMAGES, p.ex. TÉLÉVISION
5Détails des systèmes de télévision
222Circuits de studio; Dispositifs de studio; Equipements de studio
262Circuits de studio, p.ex. pour mélanger, commuter, changer le caractère de l'image, pour d'autres effets spéciaux
278Sous-titrage
G10L 17/04 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
17Identification ou vérification du locuteur
04Entraînement, enrôlement ou construction de modèle
G10L 17/18 2013.01
GPHYSIQUE
10INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
LANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
17Identification ou vérification du locuteur
18Réseaux neuronaux artificiels; Approches connexionnistes
CPC
G10L 17/04
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17Speaker identification or verification
04Training, enrolment or model building
G10L 17/18
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
17Speaker identification or verification
18Artificial neural networks; Connectionist approaches
H04N 5/278
HELECTRICITY
04ELECTRIC COMMUNICATION TECHNIQUE
NPICTORIAL COMMUNICATION, e.g. TELEVISION
5Details of television systems
222Studio circuitry; Studio devices; Studio equipment ; ; Cameras comprising an electronic image sensor, e.g. digital cameras, video cameras, TV cameras, video cameras, camcorders, webcams, camera modules for embedding in other devices, e.g. mobile phones, computers or vehicles
262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; ; Cameras specially adapted for the electronic generation of special effects
278Subtitling
Déposants
  • 深圳市欢太科技有限公司 SHENZHEN HEYTAP TECHNOLOGY CORP., LTD. [CN]/[CN]
  • OPPO广东移动通信有限公司 GUANGDONG OPPO MOBILE TELECOMMUNICATIONS CORP., LTD. [CN]/[CN]
Inventeurs
  • 叶青 YE, Qing
Mandataires
  • 深圳翼盛智成知识产权事务所(普通合伙) ESSEN PATENT & TRADEMARK AGENCY
Données relatives à la priorité
Langue de publication chinois (ZH)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) VIDEO SUBTITLE SYNTHESIS METHOD AND APPARATUS, STORAGE MEDIUM, AND ELECTRONIC DEVICE
(FR) PROCÉDÉ ET APPAREIL DE SYNTHÈSE DE SOUS-TITRES VIDÉO, SUPPORT DE STOCKAGE ET DISPOSITIF ÉLECTRONIQUE
(ZH) 视频字幕合成方法、装置、存储介质及电子设备
Abrégé
(EN)
Disclosed in the present application are a video subtitle synthesis method, comprising: obtaining voice information in a video, and obtaining a voice to be recognized according to a feature of the voice information; inputting the voice to be recognized to a d-vector voiceprint recognition model to obtain a voiceprint identifier corresponding to the voice to be recognized, the voiceprint identifier comprising a d-vector feature; performing voice recognition on the voice to be recognized to obtain corresponding text information; and synthesizing the voiceprint identifier and the text information to generate subtitles of the voice to be recognized.
(FR)
La présente invention concerne un procédé de synthèse de sous-titres vidéo, comprenant les étapes consistant à : obtenir des informations vocales dans une vidéo, et obtenir une voix à reconnaître en fonction d'une caractéristique des informations vocales ; entrer la voix à reconnaître dans un modèle de reconnaissance d'empreinte vocale de vecteur d pour obtenir un identifiant d'empreinte vocale correspondant à la voix à reconnaître, l'identifiant d'empreinte vocale comprenant une caractéristique de vecteur d ; mettre en oeuvre une reconnaissance vocale sur la voix à reconnaître pour obtenir des informations de texte correspondantes ; et synthétiser l'identifiant d'empreinte vocale et les informations de texte pour générer des sous-titres de la voix à reconnaître.
(ZH)
本申请公开了一种视频字幕合成方法,包括:获取视频当中的语音信息,根据语音信息的特征得到待识别语音,将待识别语音输入至d-vector声纹识别模型,以得到待识别语音所对应的声纹标识,声纹标识包含d-vector特征,对待识别语音进行语音识别以得到对应的文本信息,将声纹标识和文本信息进行合成,以生成待识别语音的字幕。
Dernières données bibliographiques dont dispose le Bureau international