免费人脸识别软件（人脸识别软件app推荐）

小多多 • 2022年1月25日上午1:41 • 投稿

各位同学好，今天和大家分享一下如何使用MediaPipe完成人脸实时跟踪检测，先放张图看效果，Fps值为14，右侧的输出为：每帧图像是人脸的概率，检测框的左上角坐标及框的宽高。

有需要的可以使用 cv2.VideoCapture(0) 捕获电脑摄像头。本节就用视频进行人脸识别。

1. 导入工具包

# 安装opencv
pip install opencv-contrib-python
# 安装mediapipe
pip install mediapipe
# pip install mediapipe --user  #有user报错的话试试这个
 
# 安装之后导入各个包
import cv2  #opencv
import mediapipe as mp
import time

人脸检测的相关说明见官方文档：Face Detection mediapipe

MediaPipe 人脸检测是一种识别速度超快的方法，具有 6 个特征点和多面支持。它基于BlazeFcae一个轻量级且性能良好的面部检测器，专为移动GPU推理量身定制。该探测器的超实时性能使其能够应用于任何需要精确感兴趣面部区域作为其他任务特定模型输入的实时取景器体验，例如3D面部关键点或几何估计（例如 MediaPipe Face Mesh)面部特征或表情分类以及面部区域分割。

2. 相关函数说明

从mediapipe中导入检测方法，今天我们使用人脸检测
mediapipe.solutions.face_detection。

mediapipe.solutions.hands  # 手部关键点检测
mediapipe.solutions.pose   # 人体姿态检测
mediapipe.solutions.face_mesh  # 人脸网状检测
mediapipe.solutions.face_detection  # 人脸识别
....................

（1）
mediapipe.solutions.face_detection.FaceDetection() 人脸检测函数

参数：

min_detection_confidence：默认为 0.5。人脸检测模型的最小置信值 (0-1之间)，高于该置信度则将检测视为成功。

返回值：

detections：检测到的人脸的集合，其中每个人脸都表示为一个检测原始消息，其中包含人脸的概率、1 个边界框、6 个关键点（右眼、左眼、鼻尖、嘴巴中心、右耳、左耳）。边界框由 xmin 和 width (由图像宽度归一化为 [0, 1])以及 ymin 和 height (由图像高度归一化为 [0, 1])组成。每个关键点由 x 和 y 组成，分别通过图像宽度和高度归一化为 [0, 1]。

返回值.score：获取图像是人脸的概率

返回值.location_data：获取识别框的 x, y, w, h 和 6个关键点的 x, y

返回值
.location_data.relative_bounding_box：获取识别框的 x, y, w, h

返回值
.location_data.relative_keypoints： 6个关键点的 x, y 组成的列表

（2）
mediapipe.solutions.drawing_utils.draw_landmarks() 绘制手部关键点的连线

参数：

image：需要画图的原始图片

landmark_list：检测到的手部关键点坐标

connections：连接线，需要把那些坐标连接起来

landmark_drawing_spec：坐标的颜色，粗细

connection_drawing_spec：连接线的粗细，颜色等

3. 只绘制识别框和关键点

使用 cv2.VideoCapture() 读取视频文件时，文件路径最好不要出现中文，防止报错。

变量.read() 每次执行就从视频中提取一帧图片，需要循环来不断提取。用success来接收是否能打开，返回True表示可以打开。img保存返回的的每一帧图像。

由于读入视频图像通道一般为RGB，而opencv中图像通道的格式为BGR，因此需要 cv2.cvtColor() 函数将opencv读入的视频图像转为RGB格式 cv2.COLOR_BGR2RGB。

import cv2
import mediapipe as mp
import time
 
# 导入人脸识别模块
mpFace = mp.solutions.face_detection
# 导入绘图模块
mpDraw = mp.solutions.drawing_utils
# 自定义人脸识别方法，最小的人脸检测置信度0.5
faceDetection = mpFace.FaceDetection(min_detection_confidence=0.5)
 
#（1）导入视频
filepath = 'C:\GameDownload\Deep Learning\face.mp4'
cap = cv2.VideoCapture(filepath)
 
pTime = 0  # 记录每帧图像处理的起始时间
 
#（2）处理每一帧图像
while True:
    
    # 每次取出一帧图像，返回是否读取成功(True/False)，以及读取的图像数据
    success, img = cap.read()
    
    # 将opencv导入的BGR图像转为RGB图像
    imgRGB = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    
    # 将每一帧图像传给人脸识别模块
    results = faceDetection.process(imgRGB)
    
    # 如果检测不到人脸那就返回None
    if results.detections:
        
        # 返回人脸关键点索引index，和关键点的坐标信息
        for index, detection in enumerate(results.detections):
            
            # 遍历每一帧图像并打印结果
            print(index, detection)  
            # 每帧图像返回一次是人脸的几率，以及识别框的xywh，后续返回关键点的xy坐标
            # print(detection.score)  # 是人脸的的可能性
            # print(detection.location_data.relative_bounding_box)  # 识别框的xywh
             
            # 绘制关键点信息及边界框
            mpDraw.draw_detection(img, detection)
    
    # 记录每帧图像处理所花的时间
    cTime = time.time()
    fps = 1/(cTime-pTime)  #计算fps值
    pTime = cTime  # 更新每张图像处理的初始时间
    
    # 把fps值显示在图像上,img画板;fps变成字符串;显示的位置;设置字体;字体大小;字体颜色;线条粗细
    cv2.putText(img, f'FPS: {str(int(fps))}', (10,50), cv2.FONT_HERSHEY_PLAIN, 3, (0,255,0), 3) 
    
    # 显示图像，输入窗口名及图像数据
    cv2.imshow('image', img)    
    if cv2.waitKey(50) & 0xFF==27:  #每帧滞留50毫秒后消失，ESC键退出
        break
 
# 释放视频资源
cap.release()
cv2.destroyAllWindows()

结果如下图所示，准确找到了人脸位置，并绘制识别框。右侧打印识别框和关键点信息。

4. 编辑识别框，保存人脸位置信息

在这里我更加关注识别框的位置位置，不太关心关键点的坐标信息，因此接下来我们单独绘制识别框，并把每一帧图像的人脸概率显示出来。如果有同学更关注人脸关键点，可以使用mediapipe的人脸网状检测，能得到的关键点非常多，这个我在后续章节也会写。

因此，接下来我们在上面代码的基础上继续补充。
detection.location_data.relative_bounding_box 获取检测框的左上角坐标和检测框的宽高，保保存在bbox中。如下我们可以看到识别框的信息都是归一化之后的，需要将其转换为像素坐标。

IN[21]: detection.location_data.relative_bounding_box
Out[21]: 
xmin: 0.6636191606521606
ymin: 0.16451001167297363
width: 0.1620280146598816
height: 0.28804928064346313

转换方法也很简单，只需要将比例长度x和w乘以实际图像宽度即可得到像素长度下的x和w，同理y和h。注意，像素长度一定是整数，如[200,200]，比例长度是小数，如[0.5, 0.5]

使用自定义矩形绘制函数cv2.rectangle()，现在有了像素坐标下的左上坐标xy，框的宽w和高h。就可以在原图像img上把框绘制出来。

detection.score 获取检测框的人脸概率值，返回只有一个元素的列表。detection.score[0] 提取这个元素，返回浮点型数值。

# 导入人脸识别模块
mpFace = mp.solutions.face_detection
# 导入绘图模块
mpDraw = mp.solutions.drawing_utils
# 自定义人脸识别方法，最小的人脸检测置信度0.5
faceDetection = mpFace.FaceDetection(min_detection_confidence=0.5)
 
#（1）导入视频
filepath = 'C:\GameDownload\Deep Learning\face.mp4'
cap = cv2.VideoCapture(filepath)
 
pTime = 0  # 记录每帧图像处理的起始时间
 
boxlist = []  # 保存每帧图像每个框的信息
 
#（2）处理每一帧图像
while True:
    
    # 每次取出一帧图像，返回是否读取成功(True/False)，以及读取的图像数据
    success, img = cap.read()
    
    # 将opencv导入的BGR图像转为RGB图像
    imgRGB = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    
    # 将每一帧图像传给人脸识别模块
    results = faceDetection.process(imgRGB)
    
    # 如果检测不到人脸那就返回None
    if results.detections:
        
        # 返回人脸索引index(第几张脸)，和关键点的坐标信息
        for index, detection in enumerate(results.detections):
            
            # 遍历每一帧图像并打印结果
            # print(index, detection)  
            # 每帧图像返回一次是人脸的几率，以及识别框的xywh，后续返回关键点的xy坐标
            print(detection.score)  # 是人脸的的可能性
            print(detection.location_data.relative_bounding_box)  # 识别框的xywh
            
            # 设置一个边界框，接收所有的框的xywh及关键点信息
            bboxC = detection.location_data.relative_bounding_box
            
            # 接收每一帧图像的宽、高、通道数
            ih, iw, ic = img.shape
            
            # 将边界框的坐标点从比例坐标转换成像素坐标
            # 将边界框的宽和高从比例长度转换为像素长度
            bbox = (int(bboxC.xmin * iw), int(bboxC.ymin * ih),  
                   int(bboxC.width * iw), int(bboxC.height * ih))
            
            # 有了识别框的xywh就可以在每一帧图像上把框画出来
            cv2.rectangle(img, bbox, (255,0,0), 5)  # 自定义绘制函数，不适用官方的mpDraw.draw_detection
            
            # 把人脸的概率显示在检测框上,img画板，概率值*100保留两位小数变成百分数，再变成字符串
            cv2.putText(img, f'{str(round(detection.score[0] * 100, 2))}%', 
                        (bbox[0], bbox[1]-20),   # 文本显示的位置，-20是为了不和框重合
                        cv2.FONT_HERSHEY_PLAIN,   # 文本字体类型
                        2, (0,0,255), 2)   # 字体大小; 字体颜色; 线条粗细
            
            # 保存索引，人脸概率，识别框的x/y/w/h
            boxlist.append([index, detection.score, bbox])
 
    # 记录每帧图像处理所花的时间
    cTime = time.time()
    fps = 1/(cTime-pTime)  #计算fps值
    pTime = cTime  # 更新每张图像处理的初始时间
    
    # 把fps值显示在图像上,img画板;fps变成字符串;显示的位置;设置字体;字体大小;字体颜色;线条粗细
    cv2.putText(img, f'FPS: {str(int(fps))}', (10,50), cv2.FONT_HERSHEY_PLAIN, 3, (0,255,0), 3) 
    
    # 显示图像，输入窗口名及图像数据
    cv2.imshow('image', img)    
    if cv2.waitKey(50) & 0xFF==27:  #每帧滞留50毫秒后消失，ESC键退出
        break
 
# 释放视频资源
cap.release()
cv2.destroyAllWindows()

结果如下图所示，右侧输出每帧图像的每个识别框的概率和框坐标

5. 优化识别框

接下来把识别框做的好看一些，只需要修改矩形框样式即可，我们接着上面的代码编辑。把识别框宽度调细一些，在四个角上添加粗线段。

# 导入人脸识别模块
mpFace = mp.solutions.face_detection
# 导入绘图模块
mpDraw = mp.solutions.drawing_utils
# 自定义人脸识别方法，最小的人脸检测置信度0.5
faceDetection = mpFace.FaceDetection(min_detection_confidence=0.5)
 
#（1）导入视频
filepath = 'C:\GameDownload\Deep Learning\face.mp4'
cap = cv2.VideoCapture(filepath)
 
pTime = 0  # 记录每帧图像处理的起始时间
 
boxlist = []  # 保存每帧图像每个框的信息
 
#（2）处理每一帧图像
while True:
    
    # 每次取出一帧图像，返回是否读取成功(True/False)，以及读取的图像数据
    success, img = cap.read()
    
    # 将opencv导入的BGR图像转为RGB图像
    imgRGB = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    
    # 将每一帧图像传给人脸识别模块
    results = faceDetection.process(imgRGB)
    
    # 如果检测不到人脸那就返回None
    if results.detections:
        
        # 返回人脸索引index(第几张脸)，和关键点的坐标信息
        for index, detection in enumerate(results.detections):
            
            # 遍历每一帧图像并打印结果
            # print(index, detection)  
            # 每帧图像返回一次是人脸的几率，以及识别框的xywh，后续返回关键点的xy坐标
            print(detection.score)  # 是人脸的的可能性
            print(detection.location_data.relative_bounding_box)  # 识别框的xywh
            
            # 设置一个边界框，接收所有的框的xywh及关键点信息
            bboxC = detection.location_data.relative_bounding_box
            
            # 接收每一帧图像的宽、高、通道数
            ih, iw, ic = img.shape
            
            # 将边界框的坐标点从比例坐标转换成像素坐标
            # 将边界框的宽和高从比例长度转换为像素长度
            bbox = (int(bboxC.xmin * iw), int(bboxC.ymin * ih),  
                   int(bboxC.width * iw), int(bboxC.height * ih))
            
            # 有了识别框的xywh就可以在每一帧图像上把框画出来
            # cv2.rectangle(img, bbox, (255,0,0), 5)  # 自定义绘制函数，不适用官方的mpDraw.draw_detection
            
            # 把人脸的概率显示在检测框上,img画板，概率值*100保留两位小数变成百分数，再变成字符串
            cv2.putText(img, f'{str(round(detection.score[0] * 100, 2))}%', 
                        (bbox[0], bbox[1]-20),   # 文本显示的位置，-20是为了不和框重合
                        cv2.FONT_HERSHEY_PLAIN,   # 文本字体类型
                        2, (0,0,255), 2)   # 字体大小; 字体颜色; 线条粗细
            
            # 保存索引，人脸概率，识别框的x/y/w/h
            boxlist.append([index, detection.score, bbox])
            
            
            #（3）修改识别框样式
            x, y, w, h = bbox  # 获取识别框的信息,xy为左上角坐标点
            x1, y1 = x+w, y+h  # 右下角坐标点
            
            # 绘制比矩形框粗的线段，img画板，线段起始点坐标，线段颜色，线宽为8
            cv2.line(img, (x,y), (x+20,y), (255,0,255), 4)  
            cv2.line(img, (x,y), (x,y+20), (255,0,255), 4)
            
            cv2.line(img, (x1,y1), (x1-20,y1), (255,0,255), 4)  
            cv2.line(img, (x1,y1), (x1,y1-20), (255,0,255), 4)
            
            cv2.line(img, (x1,y), (x1-20,y), (255,0,255), 4)  
            cv2.line(img, (x1, y), (x1, y+20), (255, 0, 255), 4)
 
            cv2.line(img, (x,y1), (x+20,y1), (255,0,255), 4)
            cv2.line(img, (x,y1), (x,y1-20), (255,0,255), 4)            
 
            # 在每一帧图像上绘制矩形框
            cv2.rectangle(img, bbox, (255,0,255), 1)  # 自定义绘制函数
 
    # 记录每帧图像处理所花的时间
    cTime = time.time()
    fps = 1/(cTime-pTime)  #计算fps值
    pTime = cTime  # 更新每张图像处理的初始时间
    
    # 把fps值显示在图像上,img画板;fps变成字符串;显示的位置;设置字体;字体大小;字体颜色;线条粗细
    cv2.putText(img, f'FPS: {str(int(fps))}', (10,50), cv2.FONT_HERSHEY_PLAIN, 3, (0,255,0), 3) 
    
    # 显示图像，输入窗口名及图像数据
    cv2.imshow('image', img)    
    if cv2.waitKey(50) & 0xFF==27:  #每帧滞留50毫秒后消失，ESC键退出
        break
 
# 释放视频资源
cap.release()
cv2.destroyAllWindows()

修改后的检测框效果如下

我们将坐标信息存放在了boxlist中，boxlist.append([index, detection.score, bbox]) 存放人脸索引、评分、检测框信息，把它打印出来看一下，比如某帧图像所在的视频有3张脸，每一帧都会输出0、1、2三个识别框的概率，左上角坐标xy，框的宽高wh

。。。。。。。。。。。。。。。。。。。。。。。。。
 [0, [0.9619430303573608], (98, 100, 96, 96)],
 [1, [0.9173532128334045], (457, 65, 118, 118)],
 [2, [0.8985080122947693], (268, 52, 123, 123)],
 [0, [0.9615015983581543], (98, 100, 97, 97)],
 [1, [0.9164762496948242], (457, 65, 118, 118)],
 [2, [0.9118367433547974], (269, 53, 123, 123)],
 [0, [0.9616674780845642], (97, 100, 97, 97)],
 [1, [0.9218802452087402], (272, 53, 122, 122)],
 [2, [0.9176990389823914], (456, 65, 118, 118)],
 [0, [0.9638006091117859], (97, 101, 97, 97)],
 [1, [0.9180505275726318], (276, 56, 119, 119)],
 [2, [0.9177079796791077], (456, 64, 118, 118)],
  。。。。。。。。。。。。。。。。。。。。。。。。。。

小多多创始人

0 0

包子馒头的来历（3分钟带你读懂“馒头史”）

“馒头”在宋元之前应该都是有馅的，和现在的包子，大体上没什么区别。而实心馒头的出现，已经是明朝的中后期的事了。在隋唐时期，“馒头”被称之作“饼”。当时中原地区，日常的饮食结构，基本上是南米北面，在此基础上，辅之以粟、豆、稷、黍等。但由于南方稻麦轮作制的流行，南方主食中的面食也占有很大比重。主食种类分为饼、饭、粥、糕数种。从史籍中出现的频率来看，“饼”最多，饭、粥次之，糕较少。隋唐时期的“饼食”种类繁多，见之于史籍上的就有“胡饼”、“蒸饼”、“煎饼”、“环饼”、“汤饼”等等。其中“蒸饼”，便是后来的馒头。

字里行间
2022年6月4日 • 杂谈
投稿

鞋子gs什么意思（鞋gs和普通的区别）

相信大家买过耐克或者乔丹球鞋的人都会有这样一个疑问，同样的鞋款在名称上会有所区别，经常会出现OG、GS、QS等等的缩写后缀，那这些后缀到底代表了什么意思咧？ W/WMNS/WOME…

xswh
2022年3月31日
陌陌怎么升级视频快聊（陌陌互关注了发不视频聊）

在用社交工具聊天时，不管是熟人还是陌生人，“照片很美真人很丑”总是一个避不开的坑。当你以为你的聊天对象长这样的时候：真人长相很有可能“惨不忍睹”：为了能让大伙儿在聊天时避开这种…

迅捷
2022年4月9日 • 投稿
韩国十大服装品牌(韩国10大服装品牌)

　　近年来，韩版的服装在国内非常流行，韩版女装设计简洁大方，款式非常百搭，深受广大女性朋友的追捧与喜爱，那么韩国有哪些知名的服装品牌呢?下面就让我们一起来看看韩国十大女装品牌吧! …

默默
2022年5月4日 • 投稿
淘宝开店如何提高客件数，增加客单价

[ 扬帆导读 ] 如何提高客件数，增加客单价关于关联营销的基础定义：一：什么是关联营销不同的展示位置，让流量汇聚一处二：关联营销的形式： 1、同价不同款 2、相似款不同价 …

吉米
2022年3月24日 • 投稿
diskgenius免费版恢复文件（安卓u盘恢复工具app操作方法）

分区表丢失对电脑造成的影响是巨大，轻则数据丢失重则无法开机，一般来说重新分区出错、硬盘坏道、U盘装系统等情况下发生，当遇到这种情况时我们需要进入到快启动pe系统通过分区工具Disk…

小多多
杂谈 2021年12月13日
新手通过网络挣钱的方法(网上做什么可以长期稳定赚钱真实的)

在互联网时代，每天必须要去公司上班的工作，慢慢被一些新兴行业所取代，特别是一些职业根本就不需要去公司上班，赚的钱却一点也不必白领赚得少。哪些行业工作自由钱还多，并且收入比较稳定？ …

小多多
杂谈 2021年12月13日
国内怎样看网飞（为什么叫网飞）

网飞是美国的。Netflix（Nasdaq NFLX）美国奈飞公司，简称网飞。是一家会员订阅制的流媒体播放平台，总部位于美国加利福尼亚州洛斯盖图。成立于1997年，曾经是一家在线D…

小多多
投稿 2022年1月15日
饭后做什么运动有助于消化，5个动作促进胃肠蠕动

[ 扬帆导读 ] 爱美之心人皆有之，现今时代，越来越多的人们都对外表和体型有了越来越高的要求。但是呢，很多时候这些想法都因为需要上班而得不到实施，随着生活或者是工作各方面的压力越来…

吉米
2022年3月24日 • 投稿
投稿

白矮星爆炸会形成什么（白矮星为何会发生爆炸）

科技日报社-中国科技网科技日报北京8月20日电（记者房琳琳）据物理学家组织网19日报道，一个国际空间科学家团队发现了他们认为是双星系统爆炸产生超新星后的残留物的证据——一种白矮…

迅捷
2022年4月9日
水猴子真的存在吗？无穷小亮怒怼营销号，我算是没脾气了(97怒怼)

这个表情包你见过吗？无措中带着一丝迷茫，困惑中稍显一丝怨愤。不论是表达疑问、愤怒、无奈、懵比，还是生无可恋、爱咋咋地，它都是一张蕴含丰富情绪的、很好用的、万能表情包。终于，这…

默默
2022年5月4日 • 投稿
张根硕变胖的原因是什么（黄泰京因躁郁症变贾玲）

近日，张根硕在社交平台分享近照，瘦身成功的他颜值重回巅峰时期，脸蛋上的赘肉和双下巴完全没有了，下颚线也显露了出来，有种重回当年花样美男“黄泰京”时期的感觉，再加上留着羊毛卷，满满的…

小多多
2022年1月31日 • 投稿
投稿

2020年“金仓联诚信杯”佛山河源商会篮球赛今日火热“开波”

8月9日，致敬“佛山正能量”——2020年“金仓联诚信杯”佛山市河源商会篮球赛在世博广场六楼艺力篮球馆正式开赛。本届赛事由佛山各区河源乡贤组成4支战队参赛。比赛将持续一个月，经过单…

小多多
2022年1月25日
常见的信息分类网站有哪些（全国分类信息网站排名）

从1991年8月6日蒂姆·伯纳斯－李制作的全球第一个网站上线到现在的2021年，已经过去了30年，网站的形式也随着互联网的飞速发展与人们不断变更的需求发生了很多变化分支，今天我们来…

小多多
杂谈 2021年12月13日
二驴身价多少个亿（二驴被ks封杀了吗）

二驴公开身家资产达5亿却被辛巴嘲讽是钢镚！二驴昨天在北京别墅直播，有粉丝问二驴：“你存款多少？”二驴回答：5个亿，但是我这个钱在辛巴面前就是“钢镚”，那天在丁老五直播间连麦给我埋汰…

小多多
杂谈 2021年12月10日

发表回复

登录后才能评论