前言
发现服务器里边有一个非常多照片的文件夹 CASIA-WebFace,上网探索之,现做简要记录。
简介
在大数据和深度卷积神经网络(CNN)的推动下,人脸识别的性能快速接近人类的识别效率和准确率。使用私人大规模训练数据集,几个小组在LFW上取得了很高的成绩。虽然CNN网络的开源实现有很多,大规模的人脸数据集却没有一个是开源的。所以,目前在人脸识别领域,高质量的数据比算法更加重要。为了解决这个问题,CASIA(中国科学院自动化研究所)提出了一个半自动的方式来从互联网收集人脸图像的方法,并建立了一个大型的人脸数据集:该数据集包含10575
个类别和总共494414
张图片。
所提出的CASIA-WebFaces数据集的统计如表所示:
Dataset | Subjects | Images | Availability |
---|---|---|---|
LFW[1] | 5,749 | 13,233 | Public |
WDRef [2] | 2,995 | 99,773 | Public (feature only) |
CelebFaces [3] | 10,177 | 202,599 | Private |
SFC [4] | 4,030 | 4,400,000 | Private |
CACD [5] | 2,000 | 163,446 | Public (partial annotated) |
CASIA-WebFace | 10,575 | 494,414 | Public |
为了说明CASIA-WebFace的质量,我们对它进行了大量的CNN训练,并将其准确性与最先进的方法(如DeepFace和DeepID2)进行比较。有关详细信息,请参阅以下技术报告。
免责声明:数据库是为了研究和教育目的而发布的。对于使用数据库的任何不良后果,我们不承担任何责任。
参考文献:
[1] LFW, http://vis-www.cs.umass.edu/lfw/
[2] D. Chen, X. Cao, L. Wang, F. Wen, and J. Sun. “Bayesian face revisited: A joint formulation”. In ECCV 2012, pages 566–579. Springer, 2012.
[3] Y. Sun, X. Wang, and X. Tang. “Deep learning face representation by joint identification-verification”. arXiv preprint arXiv:1406.4773, 2014.
[4] Y. Taigman, M. Yang, M. Ranzato, and L. Wolf. “Deepface: Closing the gap to human-level performance in face verification”. In Computer Vision and Pattern Recognition (CVPR), 2014 IEEE Conference on, pages 1701–1708. IEEE, 2014.
[5] CARC, http://bcsiriuschen.github.io/CARC/
本作品采用知识共享署名-相同方式共享 4.0 国际许可协议进行许可。欢迎转载,并请注明来自:黄钢的博客 ,同时保持文章内容的完整和以上声明信息!