Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2022205416 - PROCÉDÉ DE GÉNÉRATION D'EXPRESSION FACIALE BASÉ SUR DES RÉSEAUX ANTAGONISTES GÉNÉRATIFS

Numéro de publication WO/2022/205416
Date de publication 06.10.2022
N° de la demande internationale PCT/CN2021/085263
Date du dépôt international 02.04.2021
CIB
G06K 9/00 2006.1
GPHYSIQUE
06CALCUL; COMPTAGE
KRECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
CPC
G06K 9/00
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
Déposants
  • 深圳先进技术研究院 SHENZHEN INSTITUTES OF ADVANCED TECHNOLOGY [CN]/[CN]
Inventeurs
  • 王蕊 WANG, Rui
  • 施璠 SHI, Fan
  • 曲强 QU, Qiang
  • 姜青山 JIANG, Qingshan
Mandataires
  • 北京市诚辉律师事务所 BEIJING CHENGHUI LAW FIRM
Données relatives à la priorité
Langue de publication Chinois (zh)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) GENERATIVE ADVERSARIAL NETWORK-BASED FACIAL EXPRESSION GENERATION METHOD
(FR) PROCÉDÉ DE GÉNÉRATION D'EXPRESSION FACIALE BASÉ SUR DES RÉSEAUX ANTAGONISTES GÉNÉRATIFS
(ZH) 一种基于生成式对抗网络的人脸表情生成方法
Abrégé
(EN) Disclosed is a generative adversarial network-based facial expression generation method. The method comprises: constructing a deep learning network model, which comprises a recurrent neural network, a generator, an image discriminator, a first video discriminator, and a second video discriminator, wherein the recurrent neural network produces a time-related movement vector for an input image, the generator takes the movement vector and the input image as input, and outputs a corresponding video frame, the image discriminator is used for determining the authenticity of each video frame, the first video discriminator determines the authenticity of a video and performs classification, and the second video discriminator controls the realness and smoothness of a generated video change; training the deep learning network model using sample images containing different expression types as input; and using the trained generator to generate a facial video in real time. The present invention is able to generate an expression while retaining a facial feature, a generated video preserves continuity and realness, and same has a generalization ability for different human faces.
(FR) L'invention concerne un procédé de génération d'expression faciale basé sur des réseaux antagonistes génératifs. Le procédé consiste à : construire un modèle de réseau d'apprentissage profond, qui comprend un réseau neuronal récurrent, un générateur, un discriminateur d'image, un premier discriminateur vidéo et un second discriminateur vidéo, le réseau neuronal récurrent produisant un vecteur de mouvement lié au temps pour une image d'entrée, le générateur prenant le vecteur de mouvement et l'image d'entrée en tant qu'entrée, et délivrant en sortie une trame vidéo correspondante, le discriminateur d'image étant utilisé pour déterminer l'authenticité de chaque trame vidéo, le premier discriminateur vidéo déterminant l'authenticité d'une vidéo et effectuant une classification, et le second discriminateur vidéo commandant le réalisme et la fluidité d'un changement vidéo généré ; former le modèle de réseau d'apprentissage profond à l'aide d'images échantillon contenant différents types d'expression en tant qu'entrée ; et utiliser le générateur formé pour générer une vidéo faciale en temps réel. La présente invention est capable de générer une expression tout en conservant une caractéristique faciale, une vidéo générée préserve la continuité et le réalisme, et celle-ci a une capacité de généralisation pour différents visages humains.
(ZH) 本发明公开了一种基于生成式对抗网络的人脸表情生成方法。该方法包括:构建深度学习网络模型,其包括循环神经网络、生成器、图像判别器、第一视频判别器和第二视频判别器,其中循环神经网络针对输入图像产生时间相关的运动向量,生成器以运动向量和输入图像作为输入,输出相应的视频帧,图像判别器用于判断各视频帧的真伪,第一视频判别器判断视频的真伪并进行分类,第二视频判别器控制生成视频变化的真实性和平滑性;利用包含不同表情类别的样本图像作为输入,训练所述深度学习网络模型;利用经训练的生成器实时生成人脸视频。本发明在生成表情的同时保留人脸特征、所生成视频保持了连续性和真实性、对不同的人脸有泛化能力。
Dernières données bibliographiques dont dispose le Bureau international