Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020108396 - VIDEO CLASSIFICATION METHOD, AND SERVER

Publication Number WO/2020/108396
Publication Date 04.06.2020
International Application No. PCT/CN2019/120200
International Filing Date 22.11.2019
IPC
G06F 16/73 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
70of video data
73Querying
G06F 16/75 2019.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
70of video data
75Clustering; Classification
G06K 9/62 2006.01
GPHYSICS
06COMPUTING; CALCULATING OR COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
CPC
G06K 9/627
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
9Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
62Methods or arrangements for recognition using electronic means
6267Classification techniques
6268relating to the classification paradigm, e.g. parametric or non-parametric approaches
627based on distances between the pattern to be recognised and training or reference patterns
Applicants
  • 腾讯科技(深圳)有限公司 TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED [CN]/[CN]
Inventors
  • 马林 MA, Lin
Agents
  • 北京三高永信知识产权代理有限责任公司 BEIJING SAN GAO YONG XIN INTELLECTUAL PROPERTY AGENCY CO., LTD.
Priority Data
201811445857.929.11.2018CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) VIDEO CLASSIFICATION METHOD, AND SERVER
(FR) PROCÉDÉ DE CLASSEMENT DE VIDÉO ET SERVEUR
(ZH) 视频分类的方法以及服务器
Abstract
(EN)
Embodiments of the present application disclose a video classification method, comprising: acquiring a video to be processed, wherein the video comprises at least one video frame, and each video frame corresponds to one time point; acquiring, by means of a video classification prediction model, a visual signal feature sequence corresponding to the video; acquiring, by means of the video classification prediction model, an audio signal feature sequence corresponding to the visual signal feature sequence; generating a target signal feature sequence according to the visual signal feature sequence and the audio signal feature sequence; and acquiring, by means of the video classification prediction model, a classification prediction result corresponding to the target signal feature sequence, wherein the classification prediction result is for predicting a video type of the video. The embodiments of the present application further disclose a server. The embodiments of the present application take into consideration feature variation of both visual features and audio features in the time dimension, thereby improving video classification.
(FR)
Dans des modes de réalisation, la présente invention concerne un procédé de classement de vidéo comprenant les étapes suivantes : acquisition d'une vidéo à traiter, la vidéo comprenant au moins une trame vidéo, et chaque trame vidéo correspondant à un point temporel ; acquisition, au moyen d'un modèle de prédiction de classement de vidéo, d'une séquence de caractéristiques de signal visuel correspondant à la vidéo ; acquisition, au moyen du modèle de prédiction de classement de vidéo, d'une séquence de caractéristiques de signal audio correspondant à la séquence de caractéristiques de signal visuel ; génération d'une séquence de caractéristiques de signal cible en fonction de la séquence de caractéristiques de signal visuel et de la séquence de caractéristiques de signal audio ; et acquisition, au moyen du modèle de prédiction de classement de vidéo, d'un résultat de prédiction de classement correspondant à la séquence de caractéristiques de signal cible, le résultat de prédiction de classement étant destiné à prédire un type de vidéo de la vidéo. Les modes de réalisation de la présente invention concernent en outre un serveur. Les modes de réalisation de la présente invention prennent en considération une variation de caractéristiques des caractéristiques visuelles et des caractéristiques audio dans la dimension temporelle, ce qui permet d'améliorer le classement de vidéo.
(ZH)
本申请实施例公开了一种视频分类的方法,包括:获取待处理视频,其中,待处理视频中包含至少一个视频帧,每个视频帧对应一个时刻;通过视频分类预测模型获取待处理视频所对应的视觉信号特征序列;通过视频分类预测模型获取视觉信号特征序列所对应的音频信号特征序列;根据视觉信号特征序列以及音频信号特征序列,生成目标信号特征序列;通过视频分类预测模型获取目标信号特征序列所对应的分类预测结果,其中,分类预测结果用于预测待处理视频的视频类型。本申请实施例还公开了一种服务器。本申请实施例不但考虑到视觉特征在时间维度上的特征变化,而且还考虑到音频特征在时间维度上的特征变化,从而提升视频分类的效果。
Also published as
Latest bibliographic data on file with the International Bureau