西北大学学报(自然科学版) 2017年4月,第47卷第2期,Apr.,2017,Vo1.47,No.2 Journal of Northwest University(Natural Science Edition: 信息科学 基于深度神经网络的多尺度特征提取方法 任荣荣 ,周明全 ,耿国华 ,刘晓宁 ,王 恒 (1.西北大学信息科学与技术学院,陕西西安710127;2.北京师范大学信息科学与技术学院,北京 100875) 摘要:针对传统特征提取方法不能很好地表示左右不对称和弯曲叶片图像信息的问题,提 出一种基于深度神经网络的多尺度特征提取方法。首先借鉴空间金字塔匹配模型思想, 提取各个空间子区域的高阶Zernike矩特征,使用滑动圆形窗口提取对象域的极坐标傅里 叶变换描述子;其次将Zernike矩和傅里叶特征作为深度神经网络的输入向量获取深度抽 象特征。实验结果表明,与多种特征提取方法相比,该方法具有较好的特征表示性能。 关键词:Zernike矩;极坐标傅里叶变换;深度神经网络;支持向量机 中图分类号:TJ55;TP18 文献标识码:A DOI:10.16152/j.cnki.xdxbzr.2017-02-011 The multi.scale features extraction method based on deep neural network REN Rongrong ,ZHOU Mingquan ,GENG Guohua ,LIU Xiaoning ,WANG Heng (1.School of Information Science and Technology,Northwest University,Xi an 710127,China; 2.College of Information Science and Technology,Beijing Normal University,Beijing 100875,China) Abstract:For the problem that traditional feature extraction methods can not express the information of the a- svmmetrical and cuI、,ed blade wel1.a new classification method of multi.scale feature extraction based on deep neural network is proposed.Firstly,the high-order Zernike features moment is extracted based on spatial pyra— mid matching model from the spatial regions in the pyramid segmentation,the polar Fourier descriptor of the object regions by using sliding window.Secondly,in order to obtain the abstract features of the deep neur ̄ network,the Zernike moment and the polar Fourier descriptor are set as the input vector of the deep neural network.Finally,the recognition of the plants is achieved through the suppo ̄vector machine based on proba‘ bility.Compared with a variety of feature extraction methods,the experiment results show that the proposed al— gorithm can reach higher accuracy rate. Key words:Zernike moment;polar Fourier descriptor;deep neural network;support vector machine 地球上现存35万多种高等植物和3 1万未知 植物物种,任何人包括植物学家都不能很容易识 别这些物种。因此,利用计算机辅助识别植物种 类必然成为未来趋势。 根据叶片识别植物是一种直接有效的方法, 特征表示性能和分类器的选取直接影响分类效 果。在特征提取方面,Harish ,wu ,Kulkar. ni[3 及Kadir[ 提出利用数字几何特征描述叶轮 收稿日期:2016-04—18 基金项目:国家自然科学基金资助项目(61373117);高等学校博士学科点专项科研基金资助项目 (20136101 1 10019);研究生自主创新基金资助项目(YZZ15098) 作者简介:任荣荣,女,河南濮阳人,从事图形图像处理、模式识别研究。 西北大学学报(自然科学版) 第47卷 廓、纹理等信息,并在Flavia数据集上进行测试, 最高正确率可达到93.82%;然而提取轮廓 线¨ 时不可避免地存在各种误差,导致特征表 示性能降低。因此,Sfarl 和Hu_8 提出利用对象 夹角,R (P)为点( ,Y)径向多项式。 单位圆内的任何图像l厂( ,Y)都可以用式(4) 表示, J=∑∑z朋 (p, )。 (4) 相似性和后验概率提升表示性能。分类器选取方 面,概率神经网络(PNN) 一lo]和支持向量机 (SVM) …是最常用的分类器,DuL6 和 Zhang¨ 提出移动平均超球面和SVM+KNN融 合处理多分类问题。 传统方法不能很好地表示左右不对称和弯曲 叶片的特征,针对该问题借鉴SPM(Spatial pyra— mid matching) 13]分层思想,将图像均等分割,提 取各个空间子区域的高阶Zernike矩特征,提出使 用滑动圆形窗口识别对象域,并基于该对象域提 取极坐标傅里叶描述子,将Zernike矩¨ 和极坐 标傅里叶特征 作为深度神经网络 的输入层 向量,进一步提取优化后的深度抽象特征,在多个 经典数据集随机选取不同比例的训练集和测试 集,与多种经典特征提取方法进行比较,实验结果 表明,该方法提取的特征能够较好地表示对象。 1 理论基础 Zernikel1’ 是多项式的正交化函数,该特征具 有旋转不变性和较小数据冗余等优势。但其特征 值仅满足旋转不变性,当采用Zernike矩作为形状 描述子时,须对其进行归一化,使其满足平移和尺 度不变性。因此,文中将归一化后的高阶Zernike 矩作为特征描述子。 设图像函数为,=l厂( ,Y),Zernike矩多项表 达式{z 。( ,Y)I[1 为 : IV;q(p,O)d dy, (1) Z ( ,Y)= (P,0)=R (P)exp(jmO), (2) (P)=∑(一1) X s ( (p ))- ( s(一s ) !一s一 )) p 。(一 3) 其中,P为阶数,q为重复率,P—l q l是偶数,且P ≥q, ( ,Y)为复数函数,P表示原点到点( ,Y) 的矢量长度,0表示这个矢量与 轴逆时针方向的 将图像质心看作原点,并将像素坐标投射到 单位圆内,如果 +Y ≤1,统计单位圆内的像素 点数。 1.2 极坐标傅里叶变换 PFT特征能较好地描述目标形状和环状特 征,且抗干扰能力强,通用性高。因此,文中选用 Kadir 提出的PFT特征表示图像,该特征满足 RST不变性。可描述为 PF:(p,咖)= ,(p )exp[j2 (去)p+ ]。(5) 其中,0≤r< ,,0 =i( ),0≤i< ,0≤P< j ,0≤ < , 是径向频率, 是角频率的分辨 率。 设图像,={-厂( ,Y);0≤ <M,0≤Y<N}, 将图像投射到极坐标 :{ r,0);0≤r<R…, 0≤0<2霄}上,R 为图像轮廓质心到轮廓线的 最大半径。图像质心坐标( ,Y )为 1 M一1 1Ⅳ一1 c yc 。 (6) r和0表达式为 r=√( — 。) +(Y—Y ) , (7) 0:arc tan 。 (8) 一 为了实现PFT的尺度不变性,对 进行傅里 叶变换,得到变换系数数列PF,采用式(9)归一 化表示, = …, ,, PF(0,Tc)PF(R,,0) PF(0,0)’PF(0,0) PF(尺f, ) ———PF(O,—— 竺 — 0) _|} (9) 其中, ,是径向频率最大值, 是三角频率最 lnaX lnax 大值。 2 MSF方法 MSF(Multi—seale features)方法首先对预处理 第2期 任荣荣等:基于深度神经网络的多尺度特征提取方法 后的图像利用SPM分层策略均等分割,如图1所 示,提取L0,L。,L!层的高阶Zernike矩特征,利用 图2所示。图3描述了经PCA降维后的L:层55 个特征值,贡献率设置为95%。根据图3可知, 图2中相似植物种类在多个等特征下具有明显区 分度。 滑动圆形窗口检测对象区域,基于对象域提取 PFFD特征;其次,将L0,L1,L2层的Zernike矩特 征和PFTD特征作为DNN输入层向量,获取深度 网络抽象特征集;最后利用概率SVM分类器实现 植物分类。 2.1图像预处理 采用灰度化、高斯滤波和形态学滤波对叶片 进行预处理。 \ 图2相似植物种类 Fig.2 The similar plant species 趔 1)灰度化。叶片颜色因时间、环境等不可忽 略的外部因素产生变化,直接影响识别效果。因 此,须对彩色图像进行灰度化处理。统计每个像 素点的灰度值 Gray=0.299 R+0.578¥G+0.114:I=B. (10) 2)高斯滤波。由于数字图像在采集过程中 易受外界噪声干扰,采用高斯滤波算法消除离散 噪声。 聋 3)形态学滤波。对去噪后图像利用形态学 的开闭运算,一定程度上对缺损叶片进行了修复。 2.2特征提取 隆维后特征标号 2.2.1 Zernike矩 Ll1,L1,L2层的2~13的高阶 Zernike矩特征分别表示为: =图3相似种类z特征 Fig.3 The z vahle of the similar species [Xl, 2,…, l2], r I l I 2 2 2 4 2.2.2 PFTD特征文中利用自适应阈值分割算 Y lY,,Y2,…,Yl2,Yl,Y2,…,Yt2,…,Y,, 4 4] 法¨ 获取对象域,将叶片长轴z 作为横坐标轴, 短轴,z 作为纵坐标轴,对象被分割成4个域,再 利用滑动圆形窗口在各个区域提取PFTD特征, 半径r=l/4。 据Kadirl】 实验结果可知:R =4,Tr=6 y!,…,Y12 J, r 1 I l 2 2 2 16 z l 1,Z2,… ̄Z'12,zl,Z2’…' l 2,…, 】' 2,…,0l!J。 16 16 其中,Y =[Y ,Y ,…, ],i=1,2,3,4,表示L 层第i个空间域的12个Zernike矩特征, =[ , …时取得最佳分类效果,文中也设置相同参数。在 Flavia数据集上共提取400个PFFD特征。为了 简化计算,经PCA降维后维度变为31个。 ,, :]( =1,2,…,16)表示L 层第 个空间 域的12个Zemike矩特征。 图4为相似种类的PFTD特征值,根据图4 可知相似种类在PFFD特征下区分度不明显,恰 与Zernike矩特征互补。 2.2.3深度网络抽象特征为了训练对象本质 特征,采用包含瓶颈层的DNN¨ 进行特征优化, Ll L 瓶颈层包含节点数最少,因此,将该层节点值作为 输入向量的低维表示。图5为深度神经网络架 图1 SPM示意图 Fig.1 The diagram of spatial pyramid matching 构。 文中将每幅图像多尺度下的Zernike矩和 任选Flavia数据集中3类相似植物种类,如 PFTD特征排列成列向量 ,所有输入的n维图像 ・218・ 西北大学学报(自然科学版) 第47卷 馨 隆维后特征标号 图4相似种类PFTD特征 Fig.4 n1e PFTD value of the similar species 第2隐层 隐层 层 图5深度神经l网络架构 Fig.5 The architecture of the deep neural network 构成特征矩阵x=( , ,…, ) ,作为DNN原 始输入数据,DNN结构为1个输入层, 个隐含层 和1个输出层,第1隐含层的状态为 J h】=or(wT X+b1)。 (11) 其中,w 为输入层与第1隐层间神经元的链接权 值,b 为第1隐层的网络偏置, )= 。 (12) 对于一个由k个隐含层组成的深层网络,采 用贪婪算法逐层初始化,求解第k/2隐层即瓶颈 层的参数值, f = /( +exp(一 wT+6 )), (13) tho=X,V i∈{1,2,3,…,k/2}。 根据神经网络的反向传播性质得到全局最优 权值向量, j(w,6)=[ j(w,6’ y“ )]+ A 。 (14) _,( )= [ 胛’6. ’ , 邶 = .,(W,b; ‘“,Y‘ ), )= 一 ( )。 (15) 其中,_,(W,b)是损失函数,O/是步长系数。 图6描述了相似植物种类特征经DNN优化 后的特征值变化,可知优化后的特征使得特征区 分度更加显著。 :四 鼗 特征标号 图6相似种类dn特征 Fig.6 The dn value of the similar species 2.3分类器集成 由于SVM对小样本和非线性问题具有良好 的适应性 。因此,MSF方法采用由Lin等开发 的LIBSVM工具箱①。设叶片种类有k类,多尺度 特征集[ ,Y,z,pftd,dn],则5个特征, 个类别的 样本共需设计5k(k一1)/2个SVM分类器。其中, pftd由4个区域统计PFTD特征构成;dn由瓶颈 层特征构成。 对某一待测样本分类时,通过SVM获取[X, Y,z,pftd,dn]各个特征对应的决策值行向量 … _1] )( =1,2,3,4,5)。利用算法1获取所 有特征[X,Y,z,pftd,dn]组成的5 k概率矩阵 M5 =[C。;C:;C,;C4;C ]。c 表示在第i个特征 下待测样本属于某一类的k维向量。 算法1 决策值矩阵转化为概率矩阵算法 输入 待测样本在第i个特征下对应的k( 一1)/2维决策值行向量曰 _1] 。 第2期 任荣荣等:基于深度神经网络的多尺度特征提取方法 输出 待测样本属于某一类的k维概率行向 量CⅢ。 步骤1 初始化零矩阵 I¨ A 。 步骤2 行向量按行转化为A 的上三角矩 阵。 步骤3 当A(i , )>0,A(i , )属于第i 类;当A(i , )<0,A(i , )属于第/类。根据 A 统计该样本属于第q类的概率,C(q)= N(q)/(k(k一1)/2)。其中,N(q)为该样本判别 为第g类的SVM子分类器数量,q=1,2,…,k, C(q)为该样本在第i个特征下判定为g类的行向 量,执行 :i+i直到i=5结束。 对每个特征[ ,Y,Z,pftd,dn]对应每类的概 率值从大到小排序,获取各个特征的前3个最大 特征值对应的类别C(i ),i =1,2,…,15,依据 c(i )统计样本属于第q类的数量M(q),则该待 测样本类别为 q =arg max}M(g)}。 3实验及结果分析 为了验证MSF的有效性,采用Flavia和 Swedish数据集进行测试,与文献[8]提出的MDM 算法,以及文献[18]和[21]的算法进行实验比 较。其中,Flavia数据集共包括1 907张图像大小 不同及每类数量不等的32种植物种类;Swedish 数据集共包括1 125张图像及每类75张图像的 15种植物。 3.1参数设置 采用Libsvm工具箱自带RBF核函数的C— svm算法,正则参数c∈{4 。,4一,…,4 ,4m},核 函数g∈{4 。,4一,…,4 ,4加},利用枚举法获得 最优分类效果最佳参数C=4 与g=4 。 3.2结果对比分析 实验中采用与文献[8]相同降维方法 DNM_2 ,并采用PCA和LDA降维方法在Flavia 和Swedish数据集进行多组测试,与文献[18]和 [21]方法进行了对比,由于文献[18]和[21]特征 维度较低,因此未对其降维处理。 表1中选取与Hu_1 相同比例的Swedish数 据集,使用DNM和最近邻进行分类,文献[18]和 [21]直接使用最近邻分类,X%/Y%表示随机选 取 %作为训练集,剩余 作为测试集, +Y= 100。表2中随机选取不同比例的Flavia数据集, 使用PCA,DNM,LDA降维和SVM分类器进行分 类;表3中随机选取不同比例的Flavia数据集,均 用PCA进行降维,将SVM,NN及文中分类方法进 行对比分析。其中,MDM—CD,MDM~A, MDM—C,MDMM,MDMRA,MDM—RM是 文献[8]中距离矩阵MDM的6种扩展形式, =[X; ;z];F=[L,pftd,dn];未归一化特征为 NF;归一化特征为YF;dn表示瓶颈层特征。 表1 Swedish数据集分类结果 Tab.】The classiifcatinT1 resuhs on th Swedish dataset % MDM算法针对左右对称和完全伸展的叶片 具有较好效果,但对于不对称及缺损叶片具有明 显的局限性,由表1可知。表1采用与Hu 相同 的参数设置,文中特征与Hu_8 所有特征相比正确 率提高约12%,与文献[8]和[21]相比提高约 6%。文献[8]和[21]根据几何形态学数值计算 提取特征,对轮廓线的提取精度要求较高,然而现 存轮廓线提取算法不可避免地存在误差,文中方 法对轮廓线精度要求不高,减少了数字几何特征 对分类效果的影响。由于细粒度Zernike矩特征 和PFTD特征维度过高且奇异点和噪声点严重影 响分类精度。因此,文中采取了多种降维方法,排 除噪点降维后特征分类性能获得了较好地改善, 由表2的分类效果可知。表3在Flavia数据集上 将文中提取的神经网络优化后特征与MDM距离 特征进行对比,并利用本文设计的基于概率的 SVM与其他分类器相比具有较优且鲁棒的分类 效果;表4在Flavia数据集上随机选取90%的训 练样本,文中提取的多尺度F特征在各种分类器 下进行训练分类,从分类效果可见MSF算法针对 缺损叶片和未伸展叶片具有一定优势。 西北大学学报(自然科学版) 表2 Flavia数据集不同降维方法的SVM分类结果 Tab.2 Results on the Flavia dataset with various dimension reduction method in the SVM classifier 第47卷 % 表4 Flavia数据集上MSF与其他方法分类结果 Tab.4 Results on the Flavia dataset with MSF and other 该方法可达到约96.69%的准确率。因此,文中 methods % 方法针对缺损叶片、弯曲叶片和左右不对称叶片 也具有很好的分类效果。 4 结 论 实验表明:该方法归一化后的Zernike,PFrD 和DNN特征均满足RST不变性;SPM的分层策 针对左右不对称和弯曲叶片图像特征表示性 能不佳问题,提出了基于深度神经网络的多尺度 略有效地将全局特征和局部特征进行融合,保留 了更多的对象信息;利用圆形滑动窗检测对象,并 在对象区域内提取PFTD特征,缩小特征提取范 围和计算量;仅利用形态学特征且不需要较多的 特征提取方法。首先,借鉴SPM分层思想将图像 均等分割成多个特征层,基于该特征层提取高阶 Zernike矩特征;利用滑动圆形窗口检测对象,在 对象域极坐标提取傅里叶描述子;Zemike矩和极 坐标傅里叶描述子构成多尺度特征,再利用深度 数字几何计算,不需要考虑点对应问题,减少了特 征提取过程的时间复杂度;与多种分类方法相比, 第2期 任荣荣等:基于深度神经网络的多尺度特征提取方法 ・221・ 神经网络在该多尺度特征集上提取深度抽象特 征,实验数据表明,该特征能够较好地表示对象。 下一步工作是提取不同对象特征,提高特征表示 性能,并选用多种数据集进行实验研究。 参考文献: [1]HARISH B S,HEDGE A,VENKATESH O,et a1. Classification of plant leaves using morrhologieal fea— tures and zernike moments[C]//Advances in Compu— irng,Communications and Informatics,IEEE,2013: 1827.1831. [2]WU S G,BAO F S,XU E Y,et 1a.A leaf recognition algorithm for plant classiifcation using probabilistic neural network[C]//IEEE International Symposium on Signal Processing&Information Technology.IEEE. 2007:11—16. [3]KULKARN A H,RAI H M,JAHAGIRDAR D K A,et a1.A leaf recognition technique for plant classiifcation using RBPNN and Zernike moments[J].Computer— Mediated Communication,2013,2(1):984-988. [4] KADIR A,NUGROHO L E,SUSANTO A,et a1.Neu— ral network application on foliage plant identiifcation [J].Springer International Handbooks of Education, 2013,11(8):15—22. [5] MOUINE S,YAHIAOUI I,VERROUST—BLONDET A.A shape・based approach for leaf classification u・ sing muhiscale tirangular representation[C]∥The In— ternational Conference on Muhimedia Retrieva1.New York:ACM,2013:127—134. [6]DU J X,WANG X F,ZHANG G J.Leaf shape based plant species recognition[J].Applied Mathematics& Computation,2007,185,883—893. [7] REJEB A,BOUJEMAA N,GEMAN D.Identiifcation of plants from multiple images and botanical idkeys [C]//The International Conference on Multimedia Retireva1.New York:ACM,2013:191-198. [8]HU R X,JIA W,LING H B,et a1.Multiscale dis— tance matirx for fast plant leaf recognition[J].IEEE Transactions on Image Processing,2012,21(1 1): 4667-4672. [9] KADIR A,SANTOSA P I,NUGROHO L E,et a1. Experiments of zernike moments for leaf identiifcation [J].Theoretical&Applied Information Technology, 2012,41(1):82-93. [10]KADIR A,NUGROHO L E,SUSANTO A,et a1.Foli- age plant retireval using polar fourier transform,color moments and vein features[J].Signal&Image Pro- cessing,2011,2(3):1—13. [1 1]QUADRI A T,SIRSHAR M.Leaf recognition system using muhi-class kenrel support vector machine[J]. Computer and Communication System Engineering, 2015,2(2):260-263. [12]ZHANG H,BERG A C,MAIRE M,et a1.SVM—KNN: Discriminative nearest neighbor classification for visual category recognition[C]∥IEEE Computer Society Conference on Computer Vision&Pattern Recogni- tion.IEEE,2006,2:2126—2136. [13]LAZEBNIK S,SCHMID C,PONCE J.Beyond bags of features:Spatial pyramid matching for recognizing nat— urla scene categoric[J].Computer Vision and Pattern Recognition,2006,2:2169—2178. [14]SALVE P,SARDESAI M,MANZA R,et a1.Identifi— cation of the plants based on leaf shape descriptors [C]∥Proceedings of the Second International Confer— ence on Compnter and Communication Technologies. Spring India,2016:85一101. [15]KADIR A.Leaf identiifcation using polar Fourier transform and linear Bayes normal classiifer[C]//Bio- logical Shape Analysis:Proceedings of the 3rd Interna— tional Symposium,2015:40-49. 『l6 1 POVEY D,ZHANG X H,KHUDANPPUR S.Parallel training of DNNS with natural gradient and parameter averaging[J].Eprint Arxiv,2014,14(10):7455. [17]KHOTANZAD A,HONG Y H.Invarinat image recog— nition by Zernike moments[J].IEEE Transactions on Pattern Analysis&Machine Intelligence.1990.12 (5):489-497. [18]王丽君,淮永建,彭月橙.基于叶片图像多特征融合 的观叶植物种类识别[J],北京林业大学学报, 2015,37(1):54—61. [19]崔瑞莲,宋彦,蒋兵,等.基于深度神经网络的语种 识别[J],模式识别与人工智能,2015,28(12): 1093—1099. [2O]李帅,许悦雷,马时平,等.一种深度网络SAR遮挡 目标识别方法[J].西安电子科技大学学报(自然 科学版),2015,42(3):154-160. [21]董红霞,郭斯羽.一种结合形状与纹理特征的植物 叶片分类方法[J],计算机工程与应用,2014,50 (23):185-188. [22]JIA Y,NIE F,ZHANG C.Trace ratio problem revisi・ ted f J].IEEE Transactions on Neural Networks. 2009,20(4):729-735. (编辑李静)