【ESP32】ESP32-Face人脸识别过程概述
创始人
2024-04-15 09:46:25
0

ESP32-Face 人脸识别解析

    • 1.1 介绍
    • 1.2 人脸识别过程
    • 1.3 API 函数介绍
    • 1.4 选择识别模型
      • 1.4.1 模型比较
    • 1.5 注意事项

  1. FRMN

FRMN 是一个轻量级的人脸识别模型,专门应用与嵌入式设备,由 MobileNetV2 和 ArcFace Algorithm 结合成。

1.1 介绍

FRMN模型建立在MobileNetV2上。在训练中,使用ArcFace算法,而不是传统的Softmax函数和交叉熵损失函数。为了降低计算复杂性,在训练中使用了较小尺寸(56x56)的图像。

1.2 人脸识别过程

以下步骤是人脸识别的整个过程:

1.获取输入图像,类型为320x240分辨率。

2.启动人脸识别并获取面部 的landmark关键信息坐标。

3.使用“landmark关键信息坐标,对齐面部信息,并获得面部图像的规格。align_face

4.将对齐的面部图像输入到人脸识别算法,并生成Face IDget_face_idrecogze_face

5.将新生成的 face id 和现有的 face ids进行比较,然后获取两个face id之间的距离(通常为欧几里德距离或余弦距离)

6.通过比较这两个face ID之间的距离和指定阈值,确定这两个 face ID是否来自同一个人。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gyPi9oqp-1669881214820)(…/img/face-recognition-system.png)]

1.3 API 函数介绍

  • FACE_REC_THRESHOLD: 人脸识别阈值,默认配置为“0.7”并以余弦距离测量。

    • -距离大于“Face_REC_THRESHOLD”的任何两个face ID均视为同一个人。
    • -降低此参数可提高识别率;并增加该参数以降低错误识别率。
  • NOSE_EYE_RATIO_THRES_MIN: 鼻子与左眼距离和鼻子与右眼距离的 最小比率的阈值。

    • -任何比率低于阈值的人脸图像将被视为不合格图像并被过滤掉。
    • -降低此参数可提高面对齐的通过率。注意,这也导致在人脸识别中使用质量较差的图像。
  • NOSE_EYE_RATIO_THRES_MAX:鼻子与左眼距离和鼻子与右眼距离的 最大比率的阈值。

    • -任何比率高于阈值的人脸图像将被视为不合格图像并被过滤掉。
    • -增大此参数可提高面对齐的通过率。注意,这也导致在人脸识别中使用质量较差的图像。
  • FLASH_INFO_FLAG: ID数据标志。每当此标志打开时,ID数据存储在 flash中

  • FLASH_PARTITION_NAME: 存储face ID的 flash 分区的名称,该名称与csv文件分区中使用的名称相同。

1.4 选择识别模型

目前为止有五种可供选择的模型:

  • FRMN
  • MFN56_1X
  • MFN56_2X
  • MFN56_3X
  • MFN56_4X

准确率: MFN56_4X > MFN56_3X > MFN56_2X > MFN56_1X > FRMN

1.4.1 模型比较

ModelFRMNMFN56_1XMFN56_2XMFN56_3XMFN56_4X
Functionfrmn_qmfn56_42mmfn56_72mmfn56_112mmfn56_156m
Size1.2MB1.6MB2.0MB2.4MB3.7MB
Time363ms455ms738ms1150ms1540ms

1.5 注意事项

使用 Face Recognition Lib 时的注意事项:

  • 输入图像的格式必须为 56x56 的RGB 图像。使用其他尺寸的图像可能会降低正确识别率

  • 调用align_face() 函数开始人脸对齐(face alignment),调用函数之后,使用对齐的图像进行人脸识别

  • 若想使用 frmn_q()函数生成 face ids,请首先使用 transform_frmn_input() 函数使输入图像标准化并固定指向。

  • cos_distance()euclidean_distance() 这两个函数分别用于计算两个 face ids 的距离,分别以余弦距离和欧几里德距离表示。

    • Cosine distance:范围: [-1,1] ,两个 face ids 的距离越大,相似度越高
    • Euclidean distance: 范围: [0,4], 两个 face ids 的距离越大,相似度越高
  • 若想在flash中存储 face id,而不是在 ram中,请先配置好 flash 分区的csv文件, partitions.csv文件

  • 存储在 ram 中的数据采取 face_id_list的格式,而存储在 flash 中的数据格式如下:

    • 0-31B信息,检查flash中的内容

    • 32-39B Len,用于指示flash中ID的数量

    • 40-4095B预留

    • 每个id需要2KB,从4096B开始

相关内容

热门资讯

中证A500ETF摩根(560... 8月22日,截止午间收盘,中证A500ETF摩根(560530)涨1.19%,报1.106元,成交额...
A500ETF易方达(1593... 8月22日,截止午间收盘,A500ETF易方达(159361)涨1.28%,报1.104元,成交额1...
何小鹏斥资约2.5亿港元增持小... 每经记者|孙磊    每经编辑|裴健如 8月21日晚间,小鹏汽车发布公告称,公司联...
中证500ETF基金(1593... 8月22日,截止午间收盘,中证500ETF基金(159337)涨0.94%,报1.509元,成交额2...
中证A500ETF华安(159... 8月22日,截止午间收盘,中证A500ETF华安(159359)涨1.15%,报1.139元,成交额...
科创AIETF(588790)... 8月22日,截止午间收盘,科创AIETF(588790)涨4.83%,报0.760元,成交额6.98...
创业板50ETF嘉实(1593... 8月22日,截止午间收盘,创业板50ETF嘉实(159373)涨2.61%,报1.296元,成交额1...
港股异动丨航空股大幅走低 中国... 港股航空股大幅下跌,其中,中国国航跌近7%表现最弱,中国东方航空跌近5%,中国南方航空跌超3%,美兰...
电网设备ETF(159326)... 8月22日,截止午间收盘,电网设备ETF(159326)跌0.25%,报1.198元,成交额409....
红利ETF国企(530880)... 8月22日,截止午间收盘,红利ETF国企(530880)跌0.67%,报1.034元,成交额29.0...