WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2014205649) METHOD FOR RETRIEVING VIDEO BY USING COMPACT VIDEO THEME DESCRIPTORS
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2014/205649    International Application No.:    PCT/CN2013/077877
Publication Date: 31.12.2014 International Filing Date: 25.06.2013
IPC:
G06F 17/30 (2006.01)
Applicants: INSTITUTE OF AUTOMATION, CHINESE ACADEMY OF SCIENCES [CN/CN]; No.95 Zhongguancun East Road, Haidian District Beijing 100190 (CN)
Inventors: WANG, Liang; (CN).
TAN, Tieniu; (CN).
HUANG, Yongzhen; (CN).
ZHAO, Fang; (CN)
Agent: CHINA SCIENCE PATENT & TRADEMARK AGENT LTD.; 11/F., Bldg. D, International Finance and Economics Center No.87, West 3rd Ring North Rd., Haidian District Beijing 100089 (CN)
Priority Data:
Title (EN) METHOD FOR RETRIEVING VIDEO BY USING COMPACT VIDEO THEME DESCRIPTORS
(FR) PROCÉDÉ DE RECHERCHE DE VIDÉO PAR UTILISATION DE DESCRIPTEURS DE THÈME DE VIDÉO COMPACTS
(ZH) 一种利用紧凑视频主题描述子进行视频检索的方法
Abstract: front page image
(EN)Disclosed is a method for retrieving a video by using compact video theme descriptors based on an undirected theme model. The method comprises the following steps: extracting a local video feature and acquiring, by using a clustering algorithm, a bag-of-words (BoW) feature of a video; training a sparsely constrained non-negative undirected theme model by using the bag-of-words feature of the video to learn a theme feature of the video; and deducing the theme descriptors of the video by using the trained theme model, and retrieving the video by calculating a cosine distance between the descriptors. By using the method of the present invention, low-dimensional and sparse video theme descriptors can be extracted from high-dimensional bag-of-words features of a video, thereby greatly improving the retrieval efficiency of a large-scale database and a mobile search system with a limited bandwidth; in addition, a theme feature structure of the video can be effectively mined by using the theme model trained by using the method, so that the extracted theme descriptors still have a retrieval accuracy higher than that of original high-dimensional bag-of-words features even if dimensions are very low.
(FR)La présente invention porte sur un procédé de recherche de vidéo par utilisation de descripteurs de thème de vidéo compacts basés sur un modèle de thème non dirigé. Le procédé comprend les étapes suivantes: extraction d'une caractéristique de vidéo locale et acquisition, par utilisation d'un algorithme de regroupement, d'une caractéristique de sac de mots (BoW) d'une vidéo; apprentissage d'un modèle de thème non dirigé non négatif parcimonieusement contraint par utilisation de la caractéristique de sac de mots de la vidéo afin d'apprendre une caractéristique de thème de la vidéo; et déduction des descripteurs de thème de la vidéo par utilisation du modèle de thème appris, et recherche de la vidéo par calcul d'une distance cosinus entre les descripteurs. Par utilisation du procédé de la présente invention, des descripteurs de thème de vidéo à petit nombre de dimensions et parcimonieux peuvent être extraits à partir de caractéristiques de sac de mots à grand nombre de dimensions d'une vidéo, ce qui permet d'améliorer fortement l'efficacité de recherche dans une base de données à grande échelle et un système de recherche mobile avec une bande passante limitée; de plus, une structure de caractéristique de thème de la vidéo peut être efficacement explorée par utilisation du modèle de thème appris par utilisation du procédé, de sorte que les descripteurs de thème extraits ont encore une précision de recherche supérieure à celle des caractéristiques de sac de mots à grand nombre de dimensions originales même si le nombre de dimensions est très faible.
(ZH)本发明公开了一种利用基于无向主题模型的紧凑视频主题描述子进行视频检索的方法,该方法包括以下歩骤:提取视频局部特征并用聚类算法得到视频的词袋(BoW)特征;利用视频词袋特征训练有稀疏约束的非负无向主题模型来学习视频的主题特征;用训练好的主题模型推断视频的主题描述子,通过计算描述子之间的余弦距离来检索视频。本发明方法能够从高维的视频词袋特征中提取出低维并且稀疏的视频主题描述,从而大大提高了在大规模数据库以及带宽受限的移动搜索系统中的检索效率;同时该方法所训练的主题模型能够很好的挖掘视频的主题特征结构,因此提取出的主题描述子即使在维数很低的情况下仍然具有比原始的高维词袋特征更高的检索精确度。
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)