Processing

Please wait...

Settings

Settings

Goto Application

1. CN109784147 - Key point detection method and device, electronic equipment and storage medium

Note: Text based on automatic Optical Character Recognition processes. Please use the PDF version for legal matters

[ ZH ]

权利要求书

1.一种关键点检测方法,其特征在于,包括:
获取待检测的手势图像,将所述手势图像划分为多个区域;
针对预设的每个手部关键点,确定所述手部关键点在每个区域中出现的概率以及在每个区域中的第一坐标值;
通过所述概率与所述第一坐标值,计算所述手势关键点在所述手势图像中的第二坐标值。

2.根据权利要求1所述的关键点检测方法,其特征在于,所述针对预设的每个手部关键点,确定所述手部关键点在每个区域中出现的概率以及在每个区域中的第一坐标值的步骤包括:
提取每个区域的图像特征,将所述图像特征输入预设的卷积神经网络中的通道进行卷积操作;
针对每个手部关键点,获取所述卷积神经网络中的通道输出的所述手部关键点在每个区域中出现的概率以及在每个区域中的第一坐标值。

3.根据权利要求2所述的关键点检测方法,其特征在于,所述区域包括N个,所述手部关键点包括M个;所述卷积神经网络包括分类分支和回归分支,所述分类分支包括M个分类通道,所述回归分支包括M个横坐标通道及M个纵坐标通道;每个通道对应一个手部关键点,每个通道包括N个网格,每个网格对应一个区域;M、N均为正整数;
所述将所述图像特征输入预设的卷积神经网络中的通道进行卷积操作的步骤包括:
将N个区域的图像特征对应输入M个分类通道中的N个网格进行卷积操作,每个分类通道得到与其对应的手部关键点在每个区域中出现的概率;
将N个区域的图像特征对应输入M个横坐标通道中的N个网格进行卷积操作,每个横坐标通道得到与其对应的手部关键点在每个区域中的第一横坐标值;
将N个区域的图像特征对应输入M个纵坐标通道中的N个网格进行卷积操作,每个纵坐标通道得到与其对应的手部关键点在每个区域中的第一纵坐标值。

4.根据权利要求1所述的关键点检测方法,其特征在于,所述通过所述概率与所述第一坐标值,计算所述手势关键点在所述手势图像中的第二坐标值的步骤包括:
将所述手部关键点在每个区域中出现的概率以及在每个区域中的第一坐标值进行加权计算,得到所述手部关键点在所述手势图像中的第二坐标值。

5.根据权利要求4所述的关键点检测方法,其特征在于,所述第一坐标值包括第一横坐标值和第一纵坐标值;
所述将所述手部关键点在每个区域中出现的概率以及在每个区域中的第一坐标值进行加权计算,得到所述手部关键点在所述手势图像中的第二坐标值的步骤包括:
将所述手部关键点在每个区域中出现的概率以及在每个区域中的第一横坐标值进行加权计算,得到所述手部关键点在所述手势图像中的第二横坐标值;
将所述手部关键点在每个区域中出现的概率以及在每个区域中的第一纵坐标值进行加权计算,得到所述手部关键点在所述手势图像中的第二纵坐标值。

6.一种关键点检测装置,其特征在于,包括:
划分单元,被配置为获取待检测的手势图像,将所述手势图像划分为多个区域;
确定单元,被配置为针对预设的每个手部关键点,确定所述手部关键点在每个区域中出现的概率以及在每个区域中的第一坐标值;
计算单元,被配置为通过所述概率与所述第一坐标值,计算所述手势关键点在所述手势图像中的第二坐标值。

7.根据权利要求6所述的关键点检测装置,其特征在于,所述确定单元包括:
输入模块,被配置为提取每个区域的图像特征,将所述图像特征输入预设的卷积神经网络中的通道进行卷积操作;
获取模块,被配置为针对每个手部关键点,获取所述卷积神经网络中的通道输出的所述手部关键点在每个区域中出现的概率以及在每个区域中的第一坐标值。

8.根据权利要求7所述的关键点检测装置,其特征在于,所述区域包括N个,所述手部关键点包括M个;所述卷积神经网络包括分类分支和回归分支,所述分类分支包括M个分类通道,所述回归分支包括M个横坐标通道及M个纵坐标通道;每个通道对应一个手部关键点,每个通道包括N个网格,每个网格对应一个区域;M、N均为正整数;
所述输入模块包括:
第一输入子模块,被配置为将N个区域的图像特征对应输入M个分类通道中的N个网格进行卷积操作,每个分类通道得到与其对应的手部关键点在每个区域中出现的概率;
第二输入子模块,被配置为将N个区域的图像特征对应输入M个横坐标通道中的N个网格进行卷积操作,每个横坐标通道得到与其对应的手部关键点在每个区域中的第一横坐标值;
第三输入子模块,被配置为将N个区域的图像特征对应输入M个纵坐标通道中的N个网格进行卷积操作,每个纵坐标通道得到与其对应的手部关键点在每个区域中的第一纵坐标值。

9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行如权利要求1-5任一项所述的关键点检测方法。

10.一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1-5任一项所述的关键点检测方法。