WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Options
Langue d'interrogation
Stemming/Racinisation
Trier par:
Nombre de réponses par page
Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2018119808) PROCÉDÉ DE GÉNÉRATION DE VIDÉO STÉRÉO BASÉ SUR UN RÉSEAU NEURONAL CONVOLUTIF 3D
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2018/119808 N° de la demande internationale : PCT/CN2016/112812
Date de publication : 05.07.2018 Date de dépôt international : 29.12.2016
CIB :
G06T 3/00 (2006.01)
G PHYSIQUE
06
CALCUL; COMPTAGE
T
TRAITEMENT OU GÉNÉRATION DE DONNÉES D'IMAGE, EN GÉNÉRAL
3
Transformation géométrique de l'image dans le plan de l'image, p.ex. à partir d'un mappage binaire pour obtenir un mappage binaire afin de créer une image différente
Déposants : ZHEJIANG GONGSHANG UNIVERSITY[CN/CN]; No. 18, Xuezheng Str. Xiasha University Town Hangzhou, Zhejiang 310018, CN
Inventeurs : WANG, Xun; CN
ZHU, Leqing; CN
WANG, Huiyan; CN
Mandataire : HANGZHOU QIUSHI PATENT OFFICE CO., LTD.; Jing Liu/Room 215 Huanghongnian Science and Technology Complex Building, No. 147,Yugu Road, Xihu District Hangzhou, Zhejiang 310013, CN
Données relatives à la priorité :
Titre (EN) STEREO VIDEO GENERATION METHOD BASED ON 3D CONVOLUTIONAL NEURAL NETWORK
(FR) PROCÉDÉ DE GÉNÉRATION DE VIDÉO STÉRÉO BASÉ SUR UN RÉSEAU NEURONAL CONVOLUTIF 3D
(ZH) 一种基于3D卷积神经网络的立体视频生成方法
Abrégé :
(EN) A stereo video generation method based on a 3D convolutional neural network, used to convert a source 2D video into a stereo video playable on a 3D stereo display apparatus. The method comprises the following steps: preparing a sufficient number of non-animated 3D films as training data, and separating 3D source videos into left-eye image sequences and right-eye image sequences; removing opening portions, credits portions, and blank frames, then employing the fuzzy C-means clustering algorithm to perform shot segmentation on the left-eye image sequences, organizing a training file by using shot as unit, calculating a mean value for all of the left-eye image sequences, subtracting the mean value from the images, and using the right-eye image sequences as a training objective; and using the training data to train a constructed 3D convolutional neural network until convergence. In this way, the present invention enables acquisition of a stereo video by performing shot segmentation on a 2D source video to be converted into a stereo video, subtracting a training image mean therefrom, inputting the subtraction result into the 3D convolutional neural network acquired via training to obtain a right-eye video image sequence of the 2D video, and then combining the 2D video and the right-eye video image sequence to form the stereo video.
(FR) La présente invention concerne un procédé de génération de vidéo stéréo basé sur un réseau neuronal convolutif 3D, utilisé afin de convertir une vidéo 2D source en une vidéo stéréo pouvant être lue sur un appareil d'affichage stéréo 3D. Le procédé comprend les étapes suivantes consistant : à préparer un nombre suffisant de films 3D non animés en tant que données d'apprentissage, et à séparer des vidéos sources 3D en séquences d'image d’œil gauche et en séquences d'image d’œil droit ; à éliminer les parties d'ouverture, de parties de crédits et de trames d'ébauche, puis à utiliser l'algorithme de groupement de moyens C flou afin d'effectuer une segmentation de prise sur les séquences d'image d’œil gauche, à organiser un fichier d'apprentissage en utilisant une prise en tant qu'unité, à calculer une valeur moyenne pour toutes les séquences d'image d’œil gauche, à soustraire la valeur moyenne des images, et à utiliser les séquences d'images d’œil droit en tant qu'objectif d'apprentissage ; et à utiliser les données d'apprentissage afin d'entraîner un réseau neuronal convolutif 3D construit jusqu'à la convergence. De cette manière, la présente invention permet l'acquisition d'une vidéo stéréo par réalisation d'une segmentation de prise sur une vidéo source 2D à convertir en une vidéo stéréo, en soustrayant une moyenne d'image d'apprentissage de cette dernière, entrant le résultat de soustraction dans le réseau neuronal convolutif 3D acquis par apprentissage afin d'obtenir une séquence d'image vidéo d’œil droit de la vidéo 2D, puis combinant la vidéo 2D et la séquence d'image vidéo d’œil droit fin de former la vidéo stéréo.
(ZH) 一种基于3D卷积神经网络的立体视频生成方法,能将现有的2D视频源转换成能在3D立体显示设备上播放的立体视频。包括以下步骤:准备足够数量非动画3D电影作为训练数据,将3D视频源分离成左眼图像序列和右眼图像序列,删去片头、片尾及空白帧后,用模糊C均值聚类法对左眼图像序列进行镜头分割,并以镜头为单位组织训练文件,计算所有左眼图像序列的均值并将这些图像减去该均值,以右眼图像序列作为训练的目标。用这些训练数据训练所构造的3D卷积神经网络直到收敛。将需要转换成立体视频的2D视频源进行镜头分割并减去训练图像均值后输入到训练得到的3D卷积神经网络,将得到该2D视频的右眼视频图像序列,最终将两者合并成立体视频。
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)