Certains contenus de cette application ne sont pas disponibles pour le moment.
Si cette situation persiste, veuillez nous contacter àObservations et contact
1. (WO2016201679) PROCÉDÉ D'EXTRACTION DE CARACTÉRISTIQUE, PROCÉDÉ, DISPOSITIF ET APPAREIL DE CLASSIFICATION DE LECTURE LABIALE
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication : WO/2016/201679 N° de la demande internationale : PCT/CN2015/081824
Date de publication : 22.12.2016 Date de dépôt international : 18.06.2015
CIB :
G10L 15/24 (2013.01) ,G06K 9/62 (2006.01)
G PHYSIQUE
10
INSTRUMENTS DE MUSIQUE; ACOUSTIQUE
L
ANALYSE OU SYNTHÈSE DE LA PAROLE; RECONNAISSANCE DE LA PAROLE; TRAITEMENT DE LA PAROLE OU DE LA VOIX; CODAGE OU DÉCODAGE DE LA PAROLE OU DE SIGNAUX AUDIO
15
Reconnaissance de la parole
24
Reconnaissance de la parole utilisant des caractéristiques non acoustiques
G PHYSIQUE
06
CALCUL; COMPTAGE
K
RECONNAISSANCE DES DONNÉES; PRÉSENTATION DES DONNÉES; SUPPORTS D'ENREGISTREMENT; MANIPULATION DES SUPPORTS D'ENREGISTREMENT
9
Méthodes ou dispositions pour la lecture ou la reconnaissance de caractères imprimés ou écrits ou pour la reconnaissance de formes, p.ex. d'empreintes digitales
62
Méthodes ou dispositions pour la reconnaissance utilisant des moyens électroniques
Déposants :
华为技术有限公司 HUAWEI TECHNOLOGIES CO., LTD. [CN/CN]; 中国广东省深圳市 龙岗区坂田华为总部办公楼 Huawei Administration Building Bantian, Longgang District Shenzhen, Guangdong 518129, CN
Inventeurs :
左坤隆 ZUO, Kunlong; CN
张新曼 ZHANG, Xinman; CN
路龙宾 LU, Longbin; CN
Mandataire :
北京三高永信知识产权代理有限责任公司 BEIJING SAN GAO YONG XIN INTELLECTUAL PROPERTY AGENCY CO., LTD.; 中国北京市 海淀区学院路蓟门里和景园A座1单元102室 A-1-102, He Jing Yuan, Ji Men Li Xueyuan Road, Haidian District Beijing 100088, CN
Données relatives à la priorité :
Titre (EN) FEATURE EXTRACTION METHOD, LIP-READING CLASSIFICATION METHOD, DEVICE AND APPARATUS
(FR) PROCÉDÉ D'EXTRACTION DE CARACTÉRISTIQUE, PROCÉDÉ, DISPOSITIF ET APPAREIL DE CLASSIFICATION DE LECTURE LABIALE
(ZH) 特征提取方法、唇语分类方法、装置及设备
Abrégé :
(EN) An embodiment of the present invention provides a feature extraction method and a lip-reading classification method, device and apparatus, relating to the field of feature recognition, the method comprising: according to a time sequence of frames in a video, dividing the video into M time sub-blocks; dividing a lip portion region of each frame of each time sub-block into N space sub-blocks; assembling a video sub-block from space sub-frames at corresponding identical positions in each frame of the same time sub-block, the video comprising in total M×N video sub-blocks; calculating a lip-reading feature vector of each video sub-block, each video sub-block lip-reading feature vector being an X-dimensional vector; and combining the X-dimensional lip-reading feature vectors of the M×N video sub-blocks of the video to obtain an X×M×N-dimensional feature vector of the video. The present invention fixes the number of feature vector dimensions and does not require dynamic adjustment of the number of feature vector dimensions, simplifying operations and saving training time and classification time.
(FR) Un mode de réalisation de la présente invention concerne un procédé d'extraction de caractéristiques et un procédé, un dispositif et un appareil de classification de lecture labiale, se rapportant au domaine de reconnaissance de caractéristiques, le procédé comprenant les étapes suivantes : conformément à une séquence temporelle de trames dans une vidéo, division de la vidéo en M sous-blocs de temps ; division d'une région de portion de lèvre de chaque trame de chaque sous-bloc de temps en N sous-blocs d'espace ; assemblage d'un sous-bloc vidéo à partir des sous-trames d'espace à des positions identiques correspondantes dans chaque trame du même sous-bloc de temps, la vidéo comprenant au total M×N sous-blocs vidéo ; calcul d'un vecteur de caractéristique de lecture labiale de chaque sous-bloc vidéo, chaque vecteur de caractéristique de lecture labiale de sous-bloc vidéo étant un vecteur à X dimensions ; et combinaison des vecteurs de caractéristiques de lecture labiale à X dimensions des M×N sous-blocs vidéo de la vidéo pour obtenir un vecteur de caractéristiques à X×M×N dimensions de la vidéo. La présente invention fixe le nombre de dimensions de vecteur de caractéristique et ne nécessite pas de réglage dynamique du nombre de dimensions de vecteur de caractéristique, permettant ainsi de simplifier les opérations et de gagner du temps d'apprentissage et du temps de classification.
(ZH) 本发明实施例提供了一种特征提取方法、唇语分类方法、装置及设备,涉及特征识别领域,该方法包括:根据视频中视频帧的时间顺序,将所述视频划分为M个时间子块;将每个时间子块中每个视频帧的唇部区域划分为N个空间子块,并将同一时间子块中的各个视频帧中对应相同位置的空间子块组成一个视频子块,所述视频共得到M×N个视频子块;计算每个视频子块的唇语特征向量,每个视频子块的唇语特征向量为X维向量;将所述视频中的M×N个视频子块的X维唇语特征向量进行组合,得到所述视频的X×M×N维唇语特征向量。本发明实现了对特征维数的固定,无需对特征维数进行动态调整,简化了操作,节省了训练时间和分类时间。
front page image
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Langue de publication : chinois (ZH)
Langue de dépôt : chinois (ZH)