Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Sunday 05.04.2020 at 10:00 AM CEST
Settings

Settings

1. WO2020061008 - RECEPTIVE-FIELD-CONFORMING CONVOLUTION MODELS FOR VIDEO CODING

Publication Number WO/2020/061008
Publication Date 26.03.2020
International Application No. PCT/US2019/051458
International Filing Date 17.09.2019
IPC
G06N 3/04 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architecture, e.g. interconnection topology
G06N 3/08 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
Applicants
  • GOOGLE LLC [US/US]; 1600 Amphitheatre Parkway Mountain View, California 94043, US
Inventors
  • COELHO, Claudionor; US
  • KUUSELA, Aki; US
  • LI, Shan; US
  • HE, Dake; US
Agents
  • BASILE, JR., Andrew R.; US
  • KNIGHT, Michelle L.; US
Priority Data
16/134,16518.09.2018US
16/289,14928.02.2019US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) RECEPTIVE-FIELD-CONFORMING CONVOLUTION MODELS FOR VIDEO CODING
(FR) MODÈLES DE CONVOLUTION CONFORMES À UN CHAMP DE RÉCEPTION POUR UN CODAGE VIDÉO
Abstract
(EN)
Convolutional neural networks that determine a mode decision for encoding a block include feature extraction layers and multiple classifiers. A non-overlapping convolutional operation is performed at a feature extraction layer by setting a stride value equal to a kernel size. The block has a N×N size, and a smallest partition output for the block has a S×S size. Classification layers of each classifier receive feature maps having a feature dimension. An initial classification layer receives the feature maps as an output of a final feature extraction layer. Each classifier infers partition decisions for sub-blocks of size (αS)×(αS) of the block, wherein α is a power of 2 and α=2,..., N/S, by applying, at some successive classification layers, a 1×1 kernel to reduce respective feature dimensions; and outputting, by a last of the classification layers, an output corresponding to a N/(αS)×N/(αS)×1 output map.
(FR)
L'invention concerne des réseaux neuronaux convolutionnels qui déterminent une décision de mode pour coder un bloc, lesdits réseaux neuronaux convolutionnels comprenant des couches d'extraction de caractéristiques et de multiples classificateurs. Une opération de convolution sans chevauchement est effectuée au niveau d'une couche d'extraction de caractéristiques par réglage d'une valeur de foulée égale à une taille de noyau. Le bloc présente une taille de N × N et la sortie de partition la plus petite pour le bloc présente une taille de S × S. Des couches de classification de chaque classificateur reçoivent des cartes de caractéristiques ayant une dimension de caractéristique. Une couche de classification initiale reçoit les cartes de caractéristiques en tant que sortie d'une couche d'extraction de caractéristiques finales. Chaque classificateur déduit des décisions de partition pour des sous-blocs de taille (αS) × (αS) du bloc, α étant une puissance de 2 et α = 2.., N/S, en appliquant, au niveau de certaines couches de classification successives, un noyau de 1 × 1 pour réduire les dimensions de caractéristiques respectives ; et en produisant, par une dernière des couches de classification, une sortie correspondant à une carte de sortie N/(αS) × N/(αS) × 1.
Latest bibliographic data on file with the International Bureau