Processing

Please wait...

PATENTSCOPE will be unavailable a few hours for maintenance reason on Tuesday 25.01.2022 at 12:00 PM CET
Settings

Settings

Goto Application

1. WO2022007954 - METHOD FOR ACTION RECOGNITION BASED ON DEEP RESIDUAL NETWORK, AND RELATED PRODUCTS

Publication Number WO/2022/007954
Publication Date 13.01.2022
International Application No. PCT/CN2021/105520
International Filing Date 09.07.2021
IPC
G06K 9/00 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
G06N 3/04 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architecture, e.g. interconnection topology
Applicants
  • GUANGDONG OPPO MOBILE TELECOMMUNICATIONS CORP., LTD. [CN]/[CN]
Inventors
  • CHEN, Jiawei
  • HSIAO, Jenhao
  • HO, Chiuman
Agents
  • SCIHEAD IP LAW FIRM
Priority Data
63/050,60410.07.2020US
Publication Language English (en)
Filing Language English (EN)
Designated States
Title
(EN) METHOD FOR ACTION RECOGNITION BASED ON DEEP RESIDUAL NETWORK, AND RELATED PRODUCTS
(FR) PROCÉDÉ DE RECONNAISSANCE D'ACTION BASÉ SUR UN RÉSEAU RÉSIDUEL PROFOND ET PRODUITS ASSOCIÉS
Abstract
(EN) A method for action recognition based on a deep residual network and related products are provided. A video clip is received as an input at a first one of at least one convolution module. At least one convolution module is traversed by: processing the input with 1D filters to obtain a motion-related feature and with 2D filters to obtain an appearance-related feature; shifting the motion-related feature and subtracting the shifted motion-related feature from the motion-related feature to obtain a residual feature; obtaining an output of the convolution module, which is used as an input of succeeding convolution module until the last one of the at least one convolution module has been traversed. At least one act is recognized based on an output of the last one of the at least one convolution module. As such, model size and computational cost can be reduced.
(FR) L'invention concerne un procédé de reconnaissance d'action basé sur un réseau résiduel profond et des produits associés. Une séquence vidéo est reçue en tant qu'entrée au niveau d'un premier module de convolution d'au moins un module de convolution. Au moins un module de convolution est traversé par : le traitement de l'entrée avec des filtres 1D pour obtenir une caractéristique liée au mouvement et avec des filtres 2D pour obtenir une caractéristique liée à l'aspect; le décalage de la caractéristique liée au mouvement et la soustraction de la caractéristique liée au mouvement décalée de la caractéristique liée au mouvement pour obtenir une caractéristique résiduelle; l'obtention d'une sortie du module de convolution, qui est utilisée en tant qu'entrée du module de convolution suivant jusqu'à ce que le dernier du ou des modules de convolution ait été traversé. Au moins un acte est reconnu sur la base d'une sortie du dernier module de convolution du ou des modules de convolution. Ainsi, la taille du modèle et le coût du calcul peuvent être réduits.
Latest bibliographic data on file with the International Bureau