Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2019047971) PROCÉDÉ DE RECONNAISSANCE D'IMAGE, TERMINAL ET SUPPORT DE STOCKAGE
Dernières données bibliographiques dont dispose le Bureau international    Formuler une observation

N° de publication : WO/2019/047971 N° de la demande internationale : PCT/CN2018/105009
Date de publication : 14.03.2019 Date de dépôt international : 11.09.2018
CIB :
G06K 9/46 (2006.01)
G PHYSIQUE
06
CALCUL; COMPTAGE
K
RECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9
Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
36
Prétraitement de l'image, c. à d. traitement de l'information image sans se préoccuper de l'identité de l'image
46
Extraction d'éléments ou de caractéristiques de l'image
Déposants :
腾讯科技(深圳)有限公司 TENCENT TECHNOLOGY (SHENZHEN) COMPANY LIMITED [CN/CN]; 中国广东省深圳市 南山区高新区科技中一路腾讯大厦35层 35/F, Tencent Building Kejizhongyi Road, Midwest District of Hi-tech Park, Nanshan District Shenzhen, Guangdong 518057, CN
Inventeurs :
姜文浩 JIANG, Wenhao; CN
马林 MA, Lin; CN
刘威 LIU, Wei; CN
Mandataire :
北京三高永信知识产权代理有限责任公司 BEIJING SAN GAO YONG XIN INTELLECTUAL PROPERTY AGENCY CO., LTD.; 中国北京市 海淀区学院路蓟门里和景园A座1单元102室 A-1-102,He Jing Yuan, Ji Men Li,Xueyuan Road Haidian District Beijing 100088, CN
Données relatives à la priorité :
201710814187.211.09.2017CN
Titre (EN) IMAGE RECOGNITION METHOD, TERMINAL AND STORAGE MEDIUM
(FR) PROCÉDÉ DE RECONNAISSANCE D'IMAGE, TERMINAL ET SUPPORT DE STOCKAGE
(ZH) 图像识别方法、终端及存储介质
Abrégé :
(EN) An image recognition method, a terminal and a storage medium, belonging to the field of machine learning. The method comprises: performing, by means of an encoder, feature extraction on an image to be recognized, so as to obtain a feature vector and a first annotation vector set (101); performing initialization processing on the feature vector to obtain first initialized input data (102); based on the first annotation vector set, generating first guidance information by means of a first guidance network model, wherein the first guidance network model is used to generate guidance information according to an annotation vector set of any image (103); and based on the first guidance information, the first annotation vector set and the first initialized input data, determining a descriptive statement of the image by means of a decoder (104). The method adds, between an encoder and a decoder, a guidance network model capable of generating guidance information according to an annotation vector set of any image, and therefore, the guidance information generated by means of the guidance network model is relatively accurate, the encoding process can be accurately guided, and the quality of generating a descriptive statement is improved.
(FR) L'invention concerne un procédé de reconnaissance d'image, un terminal et un support de stockage, appartenant au domaine de l'apprentissage automatique. Le procédé consiste à : effectuer, au moyen d'un codeur, une extraction de caractéristiques sur une image à reconnaître, de façon à obtenir un vecteur de caractéristiques et un premier ensemble de vecteurs d'annotation (101) ; effectuer un traitement d'initialisation sur le vecteur de caractéristiques pour obtenir des premières données d'entrée initialisées (102) ; sur la base du premier ensemble de vecteurs d'annotation, générer des premières informations de guidage au moyen d'un premier modèle de réseau de guidage, le premier modèle de réseau de guidage étant utilisé pour générer des informations de guidage en fonction d'un ensemble de vecteurs d'annotation d'une image quelconque (103) ; et sur la base des premières informations de guidage, du premier ensemble de vecteurs d'annotation et des premières données d'entrée initialisées, déterminer une déclaration descriptive de l'image au moyen d'un décodeur (104). Le procédé ajoute, entre un codeur et un décodeur, un modèle de réseau de guidage permettant de générer des informations de guidage en fonction d'un ensemble de vecteurs d'annotation d'une image quelconque, et par conséquent, les informations de guidage générées au moyen du modèle de réseau de guidage sont relativement précises, le processus de codage peut être guidé avec précision, et la qualité de génération d'une déclaration descriptive est améliorée.
(ZH) 一种图像识别方法、终端及存储介质,属于机器学习领域。所述方法包括:通过编码器对待识别的图像进行特征提取,得到特征向量和第一标注向量集合(101);对该特征向量进行初始化处理,得到第一初始输入数据(102);基于该第一标注向量集合,通过第一引导网络模型生成第一引导信息,该第一引导网络模型用于根据任一图像的标注向量集合生成引导信息(103);基于该第一引导信息、该第一标注向量集合和该第一初始输入数据,通过解码器确定该图像的描述语句(104)。本方法在编码器和解码器之间增加了能够根据任一图像的标注向量集合生成引导信息的引导网络模型,因此通过该引导网络模型生成的引导信息较为准确,能够对编码过程进行准确引导,提高了生成描述语句的质量。
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JO, JP, KE, KG, KH, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)