【ESP32】ESP32-Face人脸识别过程概述
创始人
2024-04-15 09:46:25
0

ESP32-Face 人脸识别解析

    • 1.1 介绍
    • 1.2 人脸识别过程
    • 1.3 API 函数介绍
    • 1.4 选择识别模型
      • 1.4.1 模型比较
    • 1.5 注意事项

  1. FRMN

FRMN 是一个轻量级的人脸识别模型,专门应用与嵌入式设备,由 MobileNetV2 和 ArcFace Algorithm 结合成。

1.1 介绍

FRMN模型建立在MobileNetV2上。在训练中,使用ArcFace算法,而不是传统的Softmax函数和交叉熵损失函数。为了降低计算复杂性,在训练中使用了较小尺寸(56x56)的图像。

1.2 人脸识别过程

以下步骤是人脸识别的整个过程:

1.获取输入图像,类型为320x240分辨率。

2.启动人脸识别并获取面部 的landmark关键信息坐标。

3.使用“landmark关键信息坐标,对齐面部信息,并获得面部图像的规格。align_face

4.将对齐的面部图像输入到人脸识别算法,并生成Face IDget_face_idrecogze_face

5.将新生成的 face id 和现有的 face ids进行比较,然后获取两个face id之间的距离(通常为欧几里德距离或余弦距离)

6.通过比较这两个face ID之间的距离和指定阈值,确定这两个 face ID是否来自同一个人。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gyPi9oqp-1669881214820)(…/img/face-recognition-system.png)]

1.3 API 函数介绍

  • FACE_REC_THRESHOLD: 人脸识别阈值,默认配置为“0.7”并以余弦距离测量。

    • -距离大于“Face_REC_THRESHOLD”的任何两个face ID均视为同一个人。
    • -降低此参数可提高识别率;并增加该参数以降低错误识别率。
  • NOSE_EYE_RATIO_THRES_MIN: 鼻子与左眼距离和鼻子与右眼距离的 最小比率的阈值。

    • -任何比率低于阈值的人脸图像将被视为不合格图像并被过滤掉。
    • -降低此参数可提高面对齐的通过率。注意,这也导致在人脸识别中使用质量较差的图像。
  • NOSE_EYE_RATIO_THRES_MAX:鼻子与左眼距离和鼻子与右眼距离的 最大比率的阈值。

    • -任何比率高于阈值的人脸图像将被视为不合格图像并被过滤掉。
    • -增大此参数可提高面对齐的通过率。注意,这也导致在人脸识别中使用质量较差的图像。
  • FLASH_INFO_FLAG: ID数据标志。每当此标志打开时,ID数据存储在 flash中

  • FLASH_PARTITION_NAME: 存储face ID的 flash 分区的名称,该名称与csv文件分区中使用的名称相同。

1.4 选择识别模型

目前为止有五种可供选择的模型:

  • FRMN
  • MFN56_1X
  • MFN56_2X
  • MFN56_3X
  • MFN56_4X

准确率: MFN56_4X > MFN56_3X > MFN56_2X > MFN56_1X > FRMN

1.4.1 模型比较

ModelFRMNMFN56_1XMFN56_2XMFN56_3XMFN56_4X
Functionfrmn_qmfn56_42mmfn56_72mmfn56_112mmfn56_156m
Size1.2MB1.6MB2.0MB2.4MB3.7MB
Time363ms455ms738ms1150ms1540ms

1.5 注意事项

使用 Face Recognition Lib 时的注意事项:

  • 输入图像的格式必须为 56x56 的RGB 图像。使用其他尺寸的图像可能会降低正确识别率

  • 调用align_face() 函数开始人脸对齐(face alignment),调用函数之后,使用对齐的图像进行人脸识别

  • 若想使用 frmn_q()函数生成 face ids,请首先使用 transform_frmn_input() 函数使输入图像标准化并固定指向。

  • cos_distance()euclidean_distance() 这两个函数分别用于计算两个 face ids 的距离,分别以余弦距离和欧几里德距离表示。

    • Cosine distance:范围: [-1,1] ,两个 face ids 的距离越大,相似度越高
    • Euclidean distance: 范围: [0,4], 两个 face ids 的距离越大,相似度越高
  • 若想在flash中存储 face id,而不是在 ram中,请先配置好 flash 分区的csv文件, partitions.csv文件

  • 存储在 ram 中的数据采取 face_id_list的格式,而存储在 flash 中的数据格式如下:

    • 0-31B信息,检查flash中的内容

    • 32-39B Len,用于指示flash中ID的数量

    • 40-4095B预留

    • 每个id需要2KB,从4096B开始

相关内容

热门资讯

Vue.js 组件 - 自定义... 一、自定义事件作用 父组件是使用 props 传递数据给子组件,但如果子组件要把数据传...
自动深度学习auto-pyto... 安装 实测window安装不了,自己捣鼓了半天终于要成功时,报了个错 ...
我的世界Bukkit服务器插件... 十二、注册、监听事件与附魔 1.事件 1.1.注册事件 先新建一个类,这里我取名为...
JavaScript 高级3(... JavaScript 高级 1、编程思路 1.1、了解-面向过程与面向对象 面向过程 分析问题中...
Android11添加AIDL... 软件平台:Android11 硬件平台:QCS6125     直接上需...
2022.12.22 c词汇背... luster 光泽 pearly luster 珍珠光泽 haggle 讨价还价 compassio...
线上数据可以为我们带来哪些营销...       大家好,这里是小安说网控。       线上数据经过采集、清洗、分析可以转...
css样式穿透(/deep/和... css样式穿透(/deep/深度选择器)场景复现样式穿透stylus的样...
网络技术展开型介绍(超详细) ♥️作者:小刘在这里 ♥️每天分享云计算网络运维课堂笔记,疫情之下&#x...
Git__本地分支与远程分支的... 文章目录前言1. 用git checkout命令关联2.用 git push命令关联3.用 git ...