1. 研究目的与意义
在人类交往中,人脸的面部表情是非常重要的交流方式,它作为信息的载体和资源的自发的行为,在平时的生活中人与人交流也依赖它传递信息。人脸表情中包含大量情感信息,心理学家Mehrabian曾指出在人类交流过程中,语言沟通传递的信息仅仅占了7%,有38%的信息通过声音传递,而通过人脸表情传递的信息占了55%。由此可见,人脸表情是人类交流过程中最重要的情感信息获取方式。
20世纪70年代,心理学家Ekman与Friesen提出人脸动作编码系统(Facial Action Coding System, FACS),定义了一组动作单元。到80年代,两人提出了情感人脸动作编码系统(Emotional Facial ActionCoding System, EMFACS),根据不同的情感定义了生气、恶心、紧张、开心、伤心和惊讶六种基本表情。后期随着表情识别研究的深入,中性表情也被公认为一种基本表情,如图1.1所示为7种面部表情。FACS和EMFACS系统给人们提供了一个标准来描述人脸表情,成为了之后自动化人脸表情研究的重要基础。
2. 课题关键问题和重难点
本课题拟解决的关键问题主要包括以下三个方面:
(1)人脸检测、定位与跟踪,即计算机在不同的场景中检测出人脸并确定其位置,而人脸跟踪则需要进一步给出检测到的人脸有关信息随时间变化的情况。这一步骤受角度、光线以及分辨率的影响,使人脸图像在个体之间有很大差异。所以如何对人脸进行检测、定位与跟踪是需要解决的首要关键问题。
(2)表情特征检测与提取,即通过特定的算法对人脸图片提取关键的特征,然后对其进行分析。不同的表情特征提取方法会提取出不同的信息,使用表情特征提取法时应考虑下一步所采用的表情识别方法,以达到最佳的识别效果。从人脸图像中提取信息用来描述表情图像,在提取特征数据的过程中,如何避免维数危机也是关键问题所在。
3. 国内外研究现状(文献综述)
面部表情是人类表达情感和意图最为有效和普遍的方式之一[1]。人脸表情识别在人机交互、认知心理学、医疗服务、疲劳驾驶检测等领域中有众多应用。达尔文进化论发现人类脸部的丰富表情是自然选择的结果。在进化初期,古人类具有恐惧等简单表情,它协助增大了瞳孔的通光量,帮助他们在危险时成功逃脱;在社交活动中,人们逐步进化出了微笑、内疚等复杂面部动作来表达内心情感。到了现代,面部肌肉可以组合出成百上千种动作,各种族进化出各异的情感表达方式[2]。近年来,表情识别成为计算机视觉研究的热点之一,全世界有大量的研究者在这一研究中取得了不错成果。
历经了近60年的发展历程,目前人脸识别的研究主要可分为以下四个阶段[3]:一是基于模板匹配的算法、基于几何结构的算法等;二是奇异值分解法、隐马尔克夫法、Eigenfaces 特征法等;三是稀疏表示法、支持向量机(Support VectorMachines, SVM)、尺度不变特征变换(Scale-invariant FeatureTransform, SIFT)、方向梯度直方图(Histogram of OrientedGradient, HOG)、局部二值模式(Local Binary Patterns, LBP)等;四是卷积神经网络(Convolutional Neural Networks, CNN)、三元组损失函数和DeepID等深度学习网络。1971年,EKMAN 和 FRIESEN[4]对现代人脸表情识别做了开创性的工作,他们研究了人类的六种基本表情(即高兴、悲伤、惊讶、恐惧、愤怒、厌恶),系统地收集并且分类各种表情图像上千幅,对人的五官(眼睛、鼻子、嘴巴、眉毛、 脸部)进行详细描述和变化分析。
进入21世纪后,随着计算机理论的快速发展,人脸表情识别技术也快速的发展起来了。人脸表情识别技术主要是特征提取与特征分类两方面。对于静态图像的特征提取,传统特征提取的方法有LBP 特征、主成分分析 PCA 以及 Gabor 小波等,对于动态图像的特征提取,有光流法、模型法和几何法。在2002年,Liu 等[5]提出一种基于 Gabor 和 KPCA 的人脸表情识别方法,该方法识别效果显著。2007年,Zhao 等[6]通过 LBP-TOP 算法进行表情的特征提取,并结合支持向量机 SVM 进行分类。再到后来,Shan 等[7]采用 LBP 和 AdaBoost 算法对 Cohn-Kanade 数据库上的表情图片进行特征提取,再结合 SVM 进行分类,研究表明,识别效果较好。2013年起,表情识别比赛如FER2013和EmotiW从具有挑战性的真实世界场景中收集了相对充足的训练样本,促进了人脸表情识别从实验室受控环境到自然环境的转换。
4. 研究方案
人脸表情识别最基本的要求就是要识别出人脸,首先通过摄像头获取的原始人脸图片进行处理,该处理过程称为图像预处理。只有将原始图片进行预处理后才能很好的完成后期的人脸定位和特征提取等步骤。
人脸表情识别的步骤包括图像获取、图像预处理、人脸检测定位、表情识别、表情分类。图像获取主要是从摄像头进行获取图片,也可以从本地导入图片,获取后的图片可以在软件的界面中显示出来以便进行识别。图像预处理包括图像光线补偿、图像灰度化、均衡直方图、实现图像对比度增强、二值化变换等。人脸检测定位主要是将处理好的图片进行定位,标记出特征,以便进行表情特征提取,然后进行表情识别,最后实现表情分类。图4.1为人脸表情识别流程图。
5. 工作计划
2022-2023-1学期:
第15-16周:完成选题,查阅相关中英文资料,进行相关技术的学习。
第17周:与导师沟通进行课题总体规划。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。