OpenCV手部关键点检测（手势识别）代码示例

点击我爱计算机视觉标星，更快获取CVML新技术

前几日分享了learnopencv.com博主Satya Mallick发表的关于OpenCV Mask RCNN实例分割的博文（详见：OpenCV4.0 Mask RCNN 实例分割示例 C++/Python实现），展示了OpenCV作为DNN推断工具的简单用法。
昨日Satya Mallick又发表了使用OpenCV调用OpenPose工程中的手部关键点检测（hand pose estimation）模型的文章，对于想要使用手部关键点检测做手势识别、手语识别、抽烟检测等工程开发的朋友来说这是一个非常简单的上手教程。
先来看看作者发布的视频效果：

在大部分情况下还是不错的，但也出现了少数帧关键点跳变的情况。

算法思想
该文中作者使用的算法模型是CMU Perceptual Computing Lab开源的集合人体、人脸、手部关键点检测的开源库OpenPose，其中手部关键点检测（Hand Keypoint detector）算法来自CVPR2017的论文《Hand Keypoint Detection in Single Images using Multiview Bootstrapping》。
人手在3D空间由于视角不同、灵活的精细动作等原因，较难得到精确标注的数据集。在该论文中，作者提出了一种称之为Multiview Bootstrapping的手部关键点检测迭代改进算法，实现了具有较高精度的检测算法。 OpenCV手部关键点检测（手势识别）代码示例
如上图所示，作者提出首先使用少量标注的含有人手关键点的数据集训练Convolutional Pose Machines神经网络，使用31个不同视角的高清摄像头拍摄人手，用上述检测模型初步检测关键点，将这些关键点根据摄像机的位姿构建三角（triangulation），得到关键点的3D位置，再将计算得到的3D点位置重投影到每一幅不同视角的2D图像，再使用这些2D图像和关键点标注训练检测模型网络，经过几次迭代，即可以得到较为精确的手部关键点检测模型。
原论文中提出的模型可生成22个关键点，其中21个点是人手部的，第22个点代表着背景。下图展示了人手部的21个关键点位置。
OpenCV手部关键点检测（手势识别）代码示例

OpenCV手部关键点检测主要流程
1）下载模型
运行开源工程中的getModels.sh下载模型，
OpenCV手部关键点检测（手势识别）代码示例或者直接在网址：
http://posefs1.perception.cs.cmu.edu/OpenPose/models/hand/pose\_iter\_102000.caffemodel
下载。将模型放到“hand/”文件夹下。
2）加载模型和图像
使用OpenCV DNN函数readNetFromCaffe函数加载模型权重。
OpenCV手部关键点检测（手势识别）代码示例 3）推断预测
blobFromImage将图像转为blob,forward函数实现网络推断。
4）获取关键点精确位置并显示