基于卷积神经网络的人脸表情识别研究
施宇楠吴自万孙文江苏淮安223300)(淮阴师范学院物理与电子电气工程学院,有时能传达情感的往往是摘要:在人类社会中,最常见的行为便是人与人之间的交流,而交流的方式不仅仅只局限于言语,脸上浮现的表情。近年来,互联网的飞速发展,迎来了人工智能时代,人脸表情识别也走上了新的研究方向。本文简述了利用一层全连接层和一个输出层组成,输出层由6个节点组成,Python语言构建卷积神经网络框架,该卷积神经网络由三层卷积层、分别对应6种不同的表情,数据集分为训练集和测试集,训练集进入系统后,经过卷积神经网络的不断训练,提高精确度,降低误使模型更加完善,差度,最后测试集输入模型内检测精确度。计算机视觉;机器学习关键词:人脸识别;卷积神经网络;中图分类号院TP183,TP391.4文献标识码院A文章编号院2096-4390渊2020冤05-0075-02在生活中,人的表情常常代表着他所抒发的情绪和他的真实感情,因此表情是语言以外的另一种交流方式。人脸表情识自动、精准的去识别人的面部别做的就是运用计算机进行高效、表情,根据学者早期研究,将人脸表情定义为6种:惊奇、恐惧、厌恶、愤怒、高兴、悲伤。人脸表情识别有着非常广泛的应用前应用人脸表情识别景,例如可以实现人类与机器人之间的交互,以及医学方面通过人脸来对罪犯供词过程中的细节进行监测,表情识别来进行面部神经瘫痪诊断等[1]。人脸识别技术的主要研究有基于几何特征和基于代数特征机器学习的快速发展,深的方法[2],随着人工智能时代的到来,模型极大地提度学习下的BP神经网络,CNN(卷积神经网络)高了人脸识别的速度和精度,让人脸识别系统在稳定性,准确性,快速性等全方面得到了很大的提升。但存在缺陷的是,人脸特征的高复杂性导致传统模型在运算方面负载比较大,速度与准确度不高。本文研究的项目通过自己收集和引用网络数据库的人脸表情图片作为数据集,CNN作为模型算法,利用Opencv对人脸表情进行动态捕捉。1主要算法1.1卷积神经网络(ConvolutionalNeuralNetwork,CNN)卷积神经网络是一种其中包括据输入层,前馈神经网络,卷积神经网络的基本结构,卷积层,池化层,全连接层和输出层。输入层:将图片以矩阵的形式填充到输入层。卷积是两个函数的卷积层:卷积层是卷积神经网络的核心,运算,称为卷积运算[4],例如图1-2就是一个简单的卷积操作。卷积运算就是卷积核以固定的步长去乘以输入矩阵的每个元看作是提取图片的每一素,卷积核又称为此过程可以是滤波器,个部分的信息。将强度低的部分滤除从池化层:作用是保留强度高的部分,之所以要减小尺寸空而达到减小卷积运算后矩阵的尺寸大小,间大小是因为卷积运算后的矩阵大小过大的话会导致最后全连接层出现过拟合的状况会影响分类器的质量[5]。全连接层:将一系列经过卷积和池化操作后的数据放入全在这片文章中,根据6种表情,可连接层中,输出类别分值向量,以将全连接层的输出为1*6的向量。Softmax函数:Softmax函数用于分类,将多个神经元的输出(0,映射到1)的区间中,使用归一化函数将分类转化为概率的比较问题。激活函数:由于线性模型只能对线性可分的训练集达到较在神经网络好的分类效果,因此我们需要对其进行非线性变换,中常用的激活函数有Sigmoid,Tanh,Relu等,在此次的研究过程中使用的是Relu函数。卷积神经网络的运作过程:将图片以矩阵的形式输入到输然后再经过池入层,接着在卷积层的卷积运算下进行特征提取,化层进行空间尺寸的减小,可以把卷积层和池化层看作是一次最后的全操作,卷积神经网络的计算就是若干次重复以上操作,输出类别对应的值。连接层对图片进行分类,1.2卷积神经网络的训练1.2.1前向传播设x为训练样本集中的样本,y为样本x对应的类别标签,在本次实验中,x为图片的尺寸大小,y为图片对应表情的类别标签,将x输入到卷积神经网络中,经过卷积,池化,全连接最后到输出层(在此过程中,每一层的输出都是后一层的输入),输出层是一个6维的向量,其中每一维代表一种表情的概率大小。1.2.2后向误差传播来输出与类别标签y向量值的误差,使用最小化均方误差,反向一层层更新权值。本次研究采用梯度的方式进行反向误差传播。1.3训练目标将预处理后的训练集味入输入层,根据输出值与类别标签值的误差进行迭代更新,每训练一定的次数将测试集的数据进当准确值高于0.8并且收敛的时候停止行测试,来观测准确值,训练,最后将训练好的模型保存。2建立人脸表情数据集扩库因此为了在人脸表情识别系统中,对象针对的是人脸表情,可以使提高精确度,舍弃头发,耳朵,脖子等与表情无关的部分,(Opencv)用相应软件对图片进行人脸特征提取。为了解决图片的多样性从而提取尽量多的人脸表情特征,对表情数据集进行一系列扩展处理。在训练卷积神经网络时,需要大量使用各种各样的训练数据,一方面可以提高人脸表情识别的精确度,另一方面可以防止过多训练造成的过拟合现象。镜像,添加噪声等方式来对于训练数据集,我们可以通过旋转,镜像和旋转。图拓展。本次研究对人脸表情照片进行两个操作:在5°到15°以内。通过数据扩展,数像旋转的角度不宜过大,据集更加多样,并且容纳了更多不同情况,使得数据集更加可靠。3实验结果及分析(转下页)-76-科学技术创新2020.05
基于GoogleEarth的遥感图像信息获取
焦雯雯(哈尔滨师范大学,黑龙江哈尔滨150025)分辨率也越来越高,与此同摘要:随着国内外遥感技术及其相干撑持技术的高速开展,遥感图像的获取平台越来越宽泛,给人们带来了极大的便利。其中近几年美国谷歌公时处理遥感影像的软件也层出不穷,使得遥感影像更加贴近人们的生产生活,更是因为其多样化的处理方式及人司推出的谷歌地球软件在众多同类软件中脱颖而出,不仅仅是因为极高的遥感影像分辨率,以及运用谷歌地球性化的操作方法,多源信息复合及三维立体技术更是使人们仿佛身临其境一般。本文主要介绍谷歌地球软件,总结其优缺点。软件获取和处理图像,再将其进行转换和编辑。同时与其他同类软件进行对比分析,关键词:谷歌地球;遥感影像;高分辨率;Arcgis中图分类号院P237文献标识码院A文章编号院2096-4390渊2020冤05-0076-021概述以及传感器技术的更新与近年来,随着卫星遥感,计算机,影像的空间,时间分辨率提高,遥感影像的获取模式越来越多,这使得遥感影像的数据越来越高,数据的获取实力也越来越强,资源也越来越多,专注于卫星影像获取业务的公司也逐渐多了其中谷歌公司近年起来,影像获取,处理的软件更是层出不穷,来研发的谷歌地球成为了行业中的翘楚。资源管理,旅游规划和物流该软件在地理教学,交通领域,行业等众多行业得到了广泛的应用,特别是其精度高,时效性强,真实性高,免费获取的特点为日常的应用提供了可能。但在对这些功能进行开发或者二次开发的前提是影像的获出现了许多可以获取与处理,好在随着谷歌地球的日益普遍,取谷歌地球影像的软件,但由于其影像存在坐标加密和偏移的本次实验采用CK+人脸表情数据库,方法采用基于卷积神经网络模型,进行训练。Loss率表示每次迭代训练的结果与目标值的误差程度,Ess为准确度,即验证集进行检验的准确程度。在Loss率训练跟踪中,一共更新了2500轮,前1000轮更新的Loss率下降的速率比较快,后1500轮更新的速率变化很小。在Ess率训练跟踪中,测试集的准确率在1600轮次左右开始向1收敛,由Loss率和准确率可以调整训练的次数为1600左右,此做法可以大大减少过拟合的可能性。为了验证卷积神经网络的快速性与准确性,本次采用K-卷积神经网络的卷近邻法和BP-神经网络框架模型进行对比。积层和池化层起到了滤波作用把图像的主要特征部分提取出来,再进行训练,对于神经网络,大大地减小了计算的复杂程度,节约了大量的训练时间。在500次时,同样对每个模型进行2500次的训练,CNN,BP神经网络,K-近邻的Loss率分别为0.83,0.91,0.93,Ess率为0.43,0.34,0.29此时看不出什么特别大的区别,但到1000轮差距开始变大,CNN的Loss率此时已经下降到0.51,但BP神经网络和K-近邻仅仅降到了0.8左右,CNN的Ess率上升到0.8,相较于0.5左右的BP神经网络和K-近邻在速度上和准确性上在1400轮,都有很大的提升,卷积神经网络的准确率先收敛于1,bp神经网络在1600轮收敛,最后的K-近邻在1700时收敛。以上对比可以看出,虽然三种模型Ess率最后都成功的收敛于于1,但卷积神经网络模型的训练相比传统的k-近邻法和情况,需要进行后处理[1]。本文主要就是通过谷歌地球获得专业所需的全数据影像资加工具体步骤进行探讨。源,提取所需地物,再进行具体的处理,2基于谷歌地球的遥感图像信息获取与转换2.1谷歌地球影像级别划分及其分辨率谷歌地球的遥感影像数据源主要分为两部分:卫星数据与航拍数据。其中卫星数据主要来自美国Landsat系列卫星数据,SpaceImagine公司的IKONOS数据,美国DigitalGlobe公司的QuickBird数据及法国SPOT系列数据;而航拍数据则主要由BlueSky公司和Sunburn公司。谷歌地球将其中影像空间分辨率其中分辨分为20个级别,随着级别升高,影像空间分辨率增大。第7级率的单位为m。,前几个级别的影像分辨较低使用较少,第(转下页)别的影像分辨率趋近于气象卫星的影像分辨率,一般的BP神经网络法在速度与准确性方面都有提升。4结论本文研究分析了基于BP神经网络,k-近邻法与卷积神经接着分析网络的分类法在CK+人脸表情库的准确性与快速性,了卷积神经网络相较BP神经网络与k-近邻而言更快速与准卷积神经网络模型实现人确的原因,通过以上的仿真分析对比,脸表情的分类识别率更高。参考文献[1]张卓群,曹钟淼,王慧等.深度学习与人脸识别算法研究[J].软件,2019,40(9):199-204,208.
居马洪,古丽娜孜艾力木江.·努尔阿迪力,乎西旦··[2]帕克扎木基于BP神经网络的人脸图像识别算法比较研究[J].信息记录材料,2019,20(9):104-107.[3]张啸,周连喆, 张琳琳.基于改进LeNet-5的面部表情识别方法[J].计算机与现代化,2019(10):83-87,93.
[4]单建华.卷积神经网络的Python实现[M].北京:人民邮电出版社,2019.
[5]张俞晴,何宁,魏润辰.基于卷积神经网络融合SIFT特征的人脸表情识别[J].计算机应用与软件,2019,36(11):161-167.
因篇幅问题不能全部显示,请点此查看更多更全内容