Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020113355 - A CONTENT ADAPTIVE ATTENTION MODEL FOR NEURAL NETWORK-BASED IMAGE AND VIDEO ENCODERS

Publication Number WO/2020/113355
Publication Date 11.06.2020
International Application No. PCT/CN2018/118847
International Filing Date 03.12.2018
IPC
G06N 3/04 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architecture, e.g. interconnection topology
G06K 9/62 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
Applicants
  • INTEL CORPORATION [US]/[US]
  • WONG, Man Lan [CN]/[CN] (BZ)
Inventors
  • WONG, Man Lan
Agents
  • CHINA PATENT AGENT (H.K.) LTD.
Priority Data
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) A CONTENT ADAPTIVE ATTENTION MODEL FOR NEURAL NETWORK-BASED IMAGE AND VIDEO ENCODERS
(FR) MODÈLE D'ATTENTION ADAPTATIF AU CONTENU DESTINÉ À DES CODEURS IMAGE ET VIDÉO FONDÉS SUR UN RÉSEAU NEURONAL
Abstract
(EN)
Various embodiments are generally directed to using attention models in neural network-based image and video encoders and/or decoders. A first feature map of a first image may be generated by a first layer of a neural network, the neural network executing on a computer processor to encode the first image. An attention layer of the neural network may compute an adaptive spatial saliency map for the first feature map of the first image based on the first feature map of the first image. The neural network may then perform an element-wise multiplication of the first feature map and the adaptive spatial saliency map for the first feature map to generate a modulated feature map to encode the first image.
(FR)
Divers modes de réalisation concernent de manière générale l'utilisation de modèles d'attention dans des codeurs et/ou des décodeurs vidéo fondés sur un réseau neuronal. Une première carte de caractéristiques d'une première image peut être générée par une première couche d'un réseau neuronal, le réseau neuronal s'exécutant sur un processeur informatique afin de coder la première image. Une couche d'attention du réseau neuronal peut calculer une carte de relief spatial adaptative pour la première carte de caractéristiques de la première image en fonction de la première carte de caractéristiques de la première image. Le réseau neuronal peut ensuite effectuer une multiplication par élément de la première carte de caractéristiques et de la carte de relief spatial adaptative pour la première carte de caractéristiques afin de générer une carte de caractéristiques modulées permettant de coder la première image.
Latest bibliographic data on file with the International Bureau