大小僅1MB!超輕量級的人臉識別模型火爆Github
近日,用戶Linzaer在Github上開源了一款適用于邊緣計算設(shè)備、移動端設(shè)備以及 PC 的超輕量級通用人臉檢測模型,該模型文件大小僅1MB,一經(jīng)開源就霸榜Github Trending榜單。
短短幾天時間,已經(jīng)在Github上標(biāo)星2.1K,398個Fork(Github地址:https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB)
據(jù)Linzaer介紹,該模型設(shè)計是針對邊緣計算設(shè)備或低算力設(shè)備(如用ARM推理)設(shè)計的,可以在低算力設(shè)備中如用ARM進(jìn)行實(shí)時的通用場景的人臉檢測推理,同樣適用于移動端、PC。
主要具有如下特性:
- 在模型大小上,默認(rèn)FP32精度下(.pth)文件大小為 1.04~1.1MB,推理框架int8量化后大小為 300KB 左右。
- 在模型計算量上,320x240的輸入分辨率下 90~109 MFlops左右。
- 模型有兩個版本,version-slim(主干精簡速度略快),version-RFB(加入了修改后的RFB模塊,精度更高)。
- 提供了320x240、640x480不同輸入分辨率下使用widerface訓(xùn)練的預(yù)訓(xùn)練模型,更好的工作于不同的應(yīng)用場景。
- 支持onnx導(dǎo)出,便于移植推理。
目前測試過正常的運(yùn)行環(huán)境如下:
- Ubuntu16.04、Ubuntu18.04、Windows 10(inference)
- Python3.6
- Pytorch1.2
- CUDA10.0 + CUDNN7.6
精度、速度、模型大小比較
訓(xùn)練集是使用Retinaface提供的清理過的widerface標(biāo)簽配合widerface數(shù)據(jù)集生成VOC訓(xùn)練集
Widerface測試
在WIDER FACE test集測試精度(單尺度輸入分辨率:320*240 或按最大邊長320等比縮放)
在WIDER FACE test集測試精度(單尺度輸入分辨率:VGA 640*480 或按最大邊長640等比縮放 )
終端設(shè)備推理速度
樹莓派4B MNN推理測試耗時 (單位:ms)(ARM/A72x4/1.5GHz/輸入分辨率 : 320x240 /int8量化)
模型大小比較
圖片效果如下: