Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020113355 - MODÈLE D'ATTENTION ADAPTATIF AU CONTENU DESTINÉ À DES CODEURS IMAGE ET VIDÉO FONDÉS SUR UN RÉSEAU NEURONAL

Numéro de publication WO/2020/113355
Date de publication 11.06.2020
N° de la demande internationale PCT/CN2018/118847
Date du dépôt international 03.12.2018
CIB
G06N 3/04 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
NSYSTÈMES DE CALCULATEURS BASÉS SUR DES MODÈLES DE CALCUL SPÉCIFIQUES
3Systèmes de calculateurs basés sur des modèles biologiques
02utilisant des modèles de réseaux neuronaux
04Architecture, p.ex. topologie d'interconnexion
G06K 9/62 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
KRECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
62Méthodes ou dispositions pour la reconnaissance utilisant des moyens électroniques
CPC
G06K 9/62
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
G06N 3/04
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
Déposants
  • INTEL CORPORATION [US]/[US]
  • WONG, Man Lan [CN]/[CN] (BZ)
Inventeurs
  • WONG, Man Lan
Mandataires
  • CHINA PATENT AGENT (H.K.) LTD.
Données relatives à la priorité
Langue de publication anglais (EN)
Langue de dépôt anglais (EN)
États désignés
Titre
(EN) A CONTENT ADAPTIVE ATTENTION MODEL FOR NEURAL NETWORK-BASED IMAGE AND VIDEO ENCODERS
(FR) MODÈLE D'ATTENTION ADAPTATIF AU CONTENU DESTINÉ À DES CODEURS IMAGE ET VIDÉO FONDÉS SUR UN RÉSEAU NEURONAL
Abrégé
(EN)
Various embodiments are generally directed to using attention models in neural network-based image and video encoders and/or decoders. A first feature map of a first image may be generated by a first layer of a neural network, the neural network executing on a computer processor to encode the first image. An attention layer of the neural network may compute an adaptive spatial saliency map for the first feature map of the first image based on the first feature map of the first image. The neural network may then perform an element-wise multiplication of the first feature map and the adaptive spatial saliency map for the first feature map to generate a modulated feature map to encode the first image.
(FR)
Divers modes de réalisation concernent de manière générale l'utilisation de modèles d'attention dans des codeurs et/ou des décodeurs vidéo fondés sur un réseau neuronal. Une première carte de caractéristiques d'une première image peut être générée par une première couche d'un réseau neuronal, le réseau neuronal s'exécutant sur un processeur informatique afin de coder la première image. Une couche d'attention du réseau neuronal peut calculer une carte de relief spatial adaptative pour la première carte de caractéristiques de la première image en fonction de la première carte de caractéristiques de la première image. Le réseau neuronal peut ensuite effectuer une multiplication par élément de la première carte de caractéristiques et de la carte de relief spatial adaptative pour la première carte de caractéristiques afin de générer une carte de caractéristiques modulées permettant de coder la première image.
Dernières données bibliographiques dont dispose le Bureau international