Processing

Please wait...

Settings

Settings

Goto Application

1. WO2022088176 - ACTIONAL-STRUCTURAL SELF-ATTENTION GRAPH CONVOLUTIONAL NETWORK FOR ACTION RECOGNITION

Publication Number WO/2022/088176
Publication Date 05.05.2022
International Application No. PCT/CN2020/125878
International Filing Date 02.11.2020
IPC
G06K 9/00 2006.1
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
CPC
G06N 3/0454
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0454using a combination of multiple neural nets
G06N 3/0472
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
04Architectures, e.g. interconnection topology
0472using probabilistic elements, e.g. p-rams, stochastic processors
G06N 3/082
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
NCOMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
3Computer systems based on biological models
02using neural network models
08Learning methods
082modifying the architecture, e.g. adding or deleting nodes or connections, pruning
Applicants
  • HONG KONG APPLIED SCIENCE AND TECHNOLOGY RESEARCH INSTITUTE COMPANY LIMITED [CN]/[CN]
Inventors
  • LI, Hailiang
  • LIU, Yang
  • LI, Man Tik
  • LEI, Zhi Bin
Agents
  • CHINA TRUER IP
Priority Data
17/083,73829.10.2020US
Publication Language English (en)
Filing Language English (EN)
Designated States
Title
(EN) ACTIONAL-STRUCTURAL SELF-ATTENTION GRAPH CONVOLUTIONAL NETWORK FOR ACTION RECOGNITION
(FR) RÉSEAU CONVOLUTIF DE GRAPHE À AUTO-ATTENTION ACTIONNEL-STRUCTUREL POUR LA RECONNAISSANCE D'ACTIONS
Abstract
(EN) Methods, devices, and non-transitory computer readable storage medium are provided for recognizing a human action using a graph convolutional network (GCN). The method includes obtaining, by a device, a plurality of joint poses (410). The device includes a memory storing instructions and a processor in communication with the memory. The method also includes normalizing, by the device, the plurality of joint poses to obtained a plurality of normalized joint poses (420); extracting, by the device, a plurality of rough features using a modified spatial-temporal GCN (ST-GCN) from the plurality of normalized joint poses (430); reducing, by the device, a feature dimension of the plurality of rough features to obtain a plurality of dimension-shrunk features (440); refining, by the device, the plurality of dimension-shrunk features based on a self-attention model to obtain a plurality of refined features (450); and recognizing, by the device, a human action based on the plurality of refined features (460).
(FR) L'invention concerne des procédés, des dispositifs et un support de stockage non transitoire lisible par ordinateur pour reconnaître une action humaine à l'aide d'un réseau convolutif de graphe (GCN). Le procédé comprend l'obtention, par un dispositif, d'une pluralité de poses d'articulation (410). Le dispositif comprend une mémoire stockant des instructions et un processeur en communication avec la mémoire. Le procédé comprend également la normalisation, par le dispositif, de la pluralité de poses d'articulation pour obtenir une pluralité de poses d'articulation normalisées (420) ; l'extraction, par le dispositif, d'une pluralité de caractéristiques rugueuses à l'aide d'un GCN spatio-temporel modifié (ST-GCN) à partir de la pluralité de poses d'articulation normalisées (430) ; la réduction, par le dispositif, d'une dimension de caractéristique de la pluralité de caractéristiques rugueuses pour obtenir une pluralité de caractéristiques rétrécies en dimension (440) ; l'affinage, par le dispositif, de la pluralité de caractéristiques à dimension réduite sur la base d'un modèle d'auto-attention pour obtenir une pluralité de caractéristiques affinées (450) ; et la reconnaissance, par le dispositif, d'une action humaine sur la base de la pluralité de caractéristiques affinées (460).
Related patent documents
Latest bibliographic data on file with the International Bureau