搜索
您的当前位置:首页正文

基于隐层优化的RBF神经网络预测模型

来源:知库网
第36卷 第18期 VoL36 No。l8 计算机工程 2010年9月 September 2010 Computer Engineering 一 王雷能及识别技术・ 文章编号:1oo 一3428(2ol0)1 -.o191— 3 文献标识码:A 中圈分类号:TP18 基于隐层优化的RBF神经网络预测模型 王纯子,张斌 (西安建筑科技大学管理学院,西安7 10055) 攮要:提出一种基于隐层优化算法的RBF神经网络预测模型——HL0A—IRBFM。在传统的免疫径向基神经网络模型(IRBFNM)的基础上 引入粗糙集,将初始隐层空间进行划分。定义隐层区域密度和相对近似度等概念,提出边界区域中冗余点和孤立点的约减算法。优化后的 隐层空间分布均匀,能以较少的中心数覆盖整个样本空间,弥补了IRBFNM模型过分依赖参数选取的不足。实验结果证明,HLOA—IRBFM 模型比IRBFNM模型在预测性能方面具有更好的稳定性和准确性。 关健诃:粗糙集;RBF神经网络;隐层优化;免疫算法 RBF Neural Network Prediction Model Based on Hidden Layer Optimization WANG Chun-zi.ZHANG Bin fDepartment ofManagement,Xi’an University ofArchitecture and Technology,Xi’an 710055,China) [Abstract]This paper proposes a kind of RBF neural network prediction model based on hidden layer optimization algorithm,named HLOA IRBFM.By introducing rough set into the traditional Immune RBF Neural Network Model(IRBFNM),the initial hidden layer Call be classiied.Itf offers a reduction algorithm about the redundant and isolated points by defining the hidden layer area density and relative approximation.The new hidden layer space distributes evenly and the sample space Can be covered entirely with few hidden nodes,which bridges a gap of over dependence on the parameters selection of IRBFNM.Experimental result proves that prediction performance of HLOA—IRBFM is more stable and accurate than that of IRBFNM. [Key words]rough set;RBF neural network;hidden layer optimization;immunity algorithm 1概述 径向基函数(Radial Basis Function,RBF)网络因其非线性 逼近能力强、网络结构简单、学习速度快等优点而被广泛应 预测性能均令人满意。 2 HLOA-IRBFM模型结构设计 HLOA—IRBFM模型主要包括以下3个模块: 用于工程和经济预测中。将人工免疫算法的特征提取和分类 能力运用于RBF神经网络的设计,能大大增强网络对样本的 (1)初始隐层空间的生成。采用免疫算法将样本数据进行 泛化,得到的隐层应能保持抗体的多样性以及对样本数据的 识别性。在样本数据量较小的情况下,可以尽量多泛化出一 记忆和识别能力,使训练过程趋于全局最优 j。但免疫算法 中多个参数的确定将直接影响隐层分布,这是网络设计中的 主要难点。虽然文献【3—4】对免疫算法中参数的确定做了具体 规定,但在输入样本空间本身分布不均匀和数量有限的情况 下,由免疫算法直接生成的隐层结构并不能达到理想的预测 性能。文献【5】使用自回归差分移动平均方法将样本数据转化 为平稳序列,但无法解决RBF隐层节点的优质选取以及小样 本数据量下的预测问题。 些初始隐结点,以弥补样本不足所导致的知识缺失。由于下 一阶段的隐层优化算法能够对隐空间进行再处理,因此适当 放松了对参数选择的要求。 (2)隐层优化。RBF的隐结点的选取应符合以下标准:隐 层中心能够以较少的数量覆盖整个输入空间。为了追求对输 入空间的覆盖面广,以及样本数据本身分布不均匀,由免疫 算法泛化出来的初始隐层空间中必然存在很多冗余点和孤立 文献【6—8】将粗糙集理论引入神经网络,但都是在网络训 练前期对样本空间进行横向属性约减,未对网络结构进行优 化。文献【4】在AIP—RBF模型上加入对隐结点重要度的讨论, 在对隐层的进一步优化上提供了思路,但是其隐结点重要度 算法的计算量是巨大的,要将整个网络计算 次,实践起来 不大可行;并且仅根据输出结果而未考虑其对网络结构的非 线性影响就删除某隐结点也是不全面的。 影响RBF神经网络性能的重点就是隐层结点位置和数 量的选取,本文将其作为研究重点,提出一种基于隐层结构 优化算法的RBF神经网络预测模型(HLOA—IRBFM),用于房 地产商品房价格预测的实验结果表明,该模型的收敛速度和 点,这些点严重影响到网络的预测性能。本文提出的隐层优 化算法可以分辨出隐层空间中的冗余知识域,并对其进行修 剪处理,调整类内和类间的密度,以便使得整个隐层空间中 的点分布均匀,从而提高模型预测性能的稳定性和准确性。 (3)RBF神经网络训练。得到隐层空间后,根据训练样本 的输入和输出数据训练网络。设得到的RBF神经网络隐结点 基金项目:陕西省重点学科建设专项基金资助项目 作者简介:王纯子(1983一),女,博士,主研方向:网络安全,计算 智能;张斌,硕士 E-mail:pure326@126.corn 一收稿日期:2010—04・05 191— 为c/j=l,2,…,hideNum),选取高斯函数为径向基函数,其形 …,…2 式为:哆=exp(一 ),其中, 为径向基函数的方差(宽 0 度参数)。利用最小二乘法计算输出权重矩阵,最后对检验数 据进行预测。 HL0A—IRBFM模型结构如图1所示。 图1 HLOA-IRBFM楱重结构 3基于粗糙集的隐层优化算法 3.1基于粗糙集意义的童结点特性触分 为了能有效判别隐结点的性质,即必要点、冗余点、孤 立点,本文利用粗糙集在不确定信息上的划分能力对初始隐 层空间进行处理。 定义1将整个隐层空间看作一个信息系统,将各个隐结 点作为研究对象(即划分对象),每个隐结点的维空间为属性 空间,则初始隐层空间可以表示为 =< ,A, ,其中, 是初始隐结点集合;A为属性集合;V=t_J ,Va表示属性 a的值域; uxA— 是一个信息函数,指定U中每一个对象 C的属性值,即对c∈U、a∈A,有f(c,口)∈ 。 为了直观地描述对象之间的不可区分关系,本文引入基 于距离的近似关系来分析S中的对象,将粗糙集的等价划分 转化为距离上的相似关系。 定义2在初始隐层空间S中,(u, 是一个距离空间, 设论域 有n个隐结点对象 fc1,C2,…,C },在u上定义一 个基于距离的相似关系R,[Ci】R={c (cf,cj)≥ 且d(ci, ,)≤0 蕴含s(cf,cj)≥ ,1≤f, ≤n},其中,s(ci, ,)= d( ,cA),表示 隐结点 与cj的相似度。 以上定义说明2个隐结点的距离越小则越相似; 为相 似性阈值,当它是一个很大的阈值时得出的聚类个数很少, 而体积很大;当它较小时,得出的聚类个数很多但体积很小。 定义3设集合{ 1, 2,…,X }为RBF神经网络的输入样本 集合,U=Xl UX2u…u ,其中,置为由样本数据量泛化出 来的隐结点集合,则定义尺’为U上的一个划分,【ci]R.:{ 0∈Xi,(Ci∈Xi)}。 基于以上定义,根据相似关系R在初始隐层空间上用 k-means聚类法进行划分( n),得到一个新的类空间,该类 空间相对于按R’关系划分有所偏移。在免疫算法对样本数据 的泛化过程中,初始抗体向样本数据逼近的方向是随机的, 泛化出来的隐结点重心会有所偏移,加之样本数据本身分布 的不均匀将导致初始隐层空间的不均匀,其中必然存在冗余 点和孤立点。下文通过粗糙集中的上下近似集来判断冗余点 和孤立点的分布区域。 定义4 R和尺’为在论域U上的划分,则Xi的下近似集 为R(X )={xiI ∈U^[xA ),Xi的上近似集为麒 )= l ∈ U A[xA nx ≠ },Xi的边界定义为BN(X )=R(X )一R(X )。 一192一 根据以上对隐层初始空间基于粗糙集的定义,对冗余点 和孤立点做出如下判定: (1)将初始隐层空间 =< A, 中的冗余点分布的区 域记为RED,则: RED=U( [xlR X Ux『’[xlR BN(X,),[x1月 nN(X )}= U{ l【胡 BN(X。)NBN(X,)} 上式表明初始隐层空间中的冗余点均分布在墨边界的交 集中,即当免疫算法中样本数据之间的泛化方向有重叠时, 此时重叠部分就是 和 的共有边界。 (2)将初始隐层空间 :< ,A, 中的孤立点分布的区 域记为ISO,则: ISO={ I POSR(R3)=U (x) 其中,定义的/SO中既有孤立点也有必要点,与样本数据 距离较近的点为必要点,它们能充分代表样本数据的特征。 孤立点主要分布在离样本数据丑较远的位置且分布密度很 小,它们在网络训练中起不到逼近作用,还会影响网络性能。 3.2不同特性瞳结点的处理 在RED区域中,由于冗余点的存在,该区域的密度将远 大于其他区域的密度。下文对一些相关的密度需要做出定义。 在定义2中,U上的两两隐结点之间的距离可以取闵科 夫斯基距离,即: d(q,C,)=(∑I C/k--C 为了与免疫算法中欧式距离的度量一致,本文中令p=2, 则隐结点相似度可以定义为: (cf,c』)= (d( ,cf))=(1+(∑fCik—f肚I )“ )-。 定义5在RED区域中,若集合redo=BN(Xi)f ̄BN(Xj)={cl, Cz,…,C },则该冗余区域密度计算公式为: 删碱 : i 1S,Cj (1"{-(  ̄[elk-Cjk[2)112)-1 : I redo I m 类似地,由近似关系R’所确定的类墨,其密度为: (1+(∑m I c 一c I2) ) 1 1f∑(1+(∑I c 一c )“ ) den(X ): 生— —一,Ci, ∈蜀 定义6对整个论域U而言,隐层空间密度的计算公式为: Y ̄den(X。) , den(U)=立L———一 基于以上定义,本文给出冗余结点的约减算法描述如下: 输入类空间fx , ,…, )以及区域RED 输出约减后的RED Stepl计算隐层空间S中所有redij区域的密度den(redij)P ̄及类 Xi的密度den(X )。 Step2 IF den(redlj)>min(den(X1),den(Xj)),即边界密度大干类xi 或类x,的密度; THEN将边界区域的冗余点加入约减集并进入下一步约 减流程; ELSE Step5。 Step3设每次约减的规模为cs=R0und(r×Ired ijI),其中,Iredijl表 示redi 的隐结点个数;O<r≤1为选定的比例;Round表示取整运算。 显然比例的大小决定了约减集的规模。当r较小时,约减集规模也 较小;当r较大时,约减集规模也较大;当r取l时,约减集的规模 与red|i的规模相当。记avedis(ck)=(d(ck,xi)+d(ck,x3)/2,计算redii中 各隐结点的avedis(c ),并按由大到小的顺序排列,选取前cs个隐 结点约减。本步骤从边界交集区域redij中选择离样本数据Xi和Xj的 平均距离最大的隐结点开始约减,每次约减cs个。这样可以删除 那些代表性差的冗余点,而保留下对样本识别能力强的点。 Step4重新计算den(red ,)、den(Xi)、den(xj),并转Step2。 Step5约减冗余点结束,输出约减后的边界交集red ,。 H = H rH IHT 5实验与分析 为了证明算法的有效性,本文引用2000年一2007年各季 度西安市商品房价格及其相关影响因素数据共31组作为实 验数据,该数据来源于统计年鉴和历年房产局发布的相关材 定义7定义平均近似度A ,它代表某一区域中各隐结 点与样本中心近似度的平均值,即: 1 k=l 1 n n k=l j=l ..一 . 料。通过计算各影响因素同价格之间的相关系数,筛选出 8个主要影响因素:国内生产总值,人均可支配收入,城市 AS=二∑s(c ,Xi)=二∑(1+(∑I ct,一 I )“ ) 总人VI,开发投资,年末贷款余额,人均建筑面积,城乡居 民储蓄存款余额,年度施工面积。将样本数据归一化后作为 定义8定义相对近似度 ,它代表隐结点Ct与样本中 心的近似度与平均近似度的比值,即: (1+(∑I 一 f r)“ ) = — — ∑(1+(∑l f一 12) ) k=l j=l 。 定义9定义平均相对近似度ARS,它代表某区域中所有 隐结点相对近似度的平均值,即: ARS=∑RS 一 基于以上定义,本文给出孤立点的约减算法描述如下: 输入类空间{X ,Xz,…, )以及区域ISO 出约减后的ISO Stepl计算区域ISO中的各隐结点C 与其中的样本数据Xj的平 均相似度AS,其中C 为由x。泛化出的类x。中的隐结点。 Step2计算各隐结点的相对近似度RS。 Step3按相对近似度由低到高的顺序将 中的隐结点排序。 Step4删除相对近似度RS远远低于平均相对近似度ARS的隐 结点。 Step5约减结束,输出约减后的区域ISO。 以上部分对空间U=Xl UX2U…U 进行了类内约减平 均。样本的初始分布很可能导致类间的分布也不均匀,还需 在整个空间u上优化。当类内密度den(Xf)小于隐层空间密度 den(∽时,对类 中的部分隐结点进行约减,其约减算法与 边界区域中冗余结点的约减算法相类似,当类内密度与隐层 空间密度相近时,证明整个空间的隐结点分布趋于均匀,此 时整个隐层空间优化算法结束。 4 RBF神经网络参数确定 RBF神经网络中需要确定的参数有:宽度 和权值矩阵w。 (1)基函数宽度 的确定方法[81如下: 1)计算各类xl的类内分散度: d “ 其中,Cf为X 的类中心;di…”表示墨中的隐结点到类中心 的平均距离。 2)计算类间距离,若: d(C ,c,) 【IcI—C lI Ic 一c I 1则称xJ为墨的最近邻聚类。 3)若 为 的最近邻聚类,则类X 对应的隐层结点的基 函数宽度初始化为 =d 一 。 (2)权值W采用最小二乘法直接求解,设五r_ 】为隐层 输出矩阵,其中, II X—C l l= =exp(一— ) ZD 设权值矢量为w_1w ,W2,…,W 】。则网络输出向量 Y=HW,W=tFY,其中,日 为日的伪逆矩阵,即: 网络模型的输入和输出参数,并按照时问序列以每8组作为 一组实验数据,选择其中7组为样本数据训练网络,第8组 为测试数据,共进行24次实验对商品房价格进行预测。实验 数据分组如表I所示。 表1实验敦据分组 实验中取初始抗体规模M=30,最小克隆数目为1,最大 克隆数目为5,约减集规模r=0.2,预测数据选i=7,亲和度 阈值取0.9,相似度阈值取0.95,迭代次数为9次一12次即可 肇¥ 雌粒 收敛。其中,亲和度阈值的适当调低可泛化出多量和多样的 ㈣ ¨” 抗体,尽可能使其能覆盖整个样本空间,取0.85-0.92之间为 宜。在Visual Studio 2005 c#及Malab7.0实验环境下,为了 验证HLOA—IRBFM相对于传统IRBFNM的性能,分别用上 数据对2种模型进行24次试验。HLOA—IRBFM和IRBFNM 对实验数据集的逼近程度如图2所示。可以看出,HLOA— IRBFM得出的预测精确度整体优于IRBFNM。 图2 HLOA・IRBFM和IRBFNM的价格疆 结果对比 HLOA—IRBFM和IRBFNM预测结果的相对误差率对比 如图3所示。HLOA—IRBFM的平均相对误差率为O.069 5, 而IRBFNM则为0.139 3,其预测准确率远低于由隐层优化算 法修正过的模型。 图3 HLOA・IRBFM和IRBFNM的相对误差率对比 (下转第196页) 193一 表2进行分词后的Logitsic圄归分类器性能 (%) 1998. 【3】Lee Weesun,Liu Bing.Learning wiht Positive and Unlabeled Examples Using Weighted Logistic Regression[C]//Proc.of hte 20th International Conference on Machine Learning.Washington D.C., 表3使用4-gram特征抽取方砉l}的Logitsic分类器性蠢(%) USA:【S.n.】,2003:448-455. [41 Bratko A,Filipi ̄B,Cormack G V et a1.Spare Filtering Using Statistical Data Compression Models[J[.Machine Learning Research,2006,7:2673—2698. 【5]Littlestone N.Learning Quickly When Irrelevant Attributes Abound: 表4单分类暴和组合分奏誊在SEWM2008上的性簟(%) A New Linear-threshold Algorithm[J[.Machine Learning,1988, 2f4):285—318. 【6】Hershkop S,Stolfo J.Combining Email Models for False Posiitve Reduction[C]//Proceedings of the l lth ACM SIGKDD International Conference on Knowldege Discovery and Data Mining.Chicago, Illinois,USA:【S.n.】,2005:98—107. 4结束语 【7】Segal R,Crawford J,Kephart J,et a1.SpamGuru:An Enterprise 本文提出了一种2层结构的、多分类器组合的垃圾邮件 Anti—spam Filtering System[C]//Proceedings of the 1st Conference 过滤模型,设计并实现了一个基于该模型的在线垃圾邮件过 On Email nad Anti—spaer.California,USA:【S.n.】,2004. 滤原型系统。实验结果表明,基于比特熵的分类器通常会比 【8]Li Yang,Fang Binxing,Li Guo.A Novel Online Spam Filter Based 解码后基于内容的分类器获得更好的性能,在此基础上,本 0n URLs and Maximum Entropy MOdeI[EB/OL1.[2010-01— 文构造的组合分类器相对于单分类器能够更好地降低FP率。 091.】hap://www.ict.ac.cn/grope/down/07-09/1189134311.doc. 有待改进的方面主要是,虽然本文系统对于正常邮件误 [9】Lin Chih-jen,Weng R C,Keerthi S S.Trust Region Newton Method 判得到降低,从而使得整个系统的低FP率得到保证,但也 ofr Large—scale Logistic Regression[C]//Proceedings of the 24th 相应地增加了垃圾邮件过滤系统的负载。此外,本文系统还 International Conference on Machine Learning.Corvalis,Oregon, 需要集成图片检测以及其他的分类器,并在真实的垃圾邮件 USA:【S.n.】,2007:561—568. 过滤环境中做进一步测试分析,这是未来的主要工作。 【10】Howard P G The Design and Analysis of Efifcient Lossless Data 参考文献 Compression Systems[D[ Rhode Island,USA:Brown Universi ̄, [1】李睿,李伟娟,李明.基于加权量子粒子群的分类器设计【J】 1993. 计算机工程,2010,36(7):203—204. [11】Goodman J,Yih W T Online Discriminative Spaer Filter [2】Sahami M,Dumais S,Heckerman D,et a1.A Bayesian Approach to Training[C]//Proeeedings of the 3rd Conference On Email and Filtering Junk E—mail[C]//Proceedings of the AAAI Workshop on Anti—spam.CA,USA:2006:27—28. Learning for Text Categorization.Madison,Wisconsin,USA:is.n.】, 编辑陈晖 (上接第193页) 6结束语 Neural Network Learning Algorithra[J].IEEE Trans.on Neural 在训练样本数较少的情况下,传统的人工免疫RBF神经 Networks,1998,9(6):308—317 网络模型的预测性能较低,其预报准确度对算法中各参数和 [3】宫新保,周希朗,胡光锐.基于免疫进化算法的径向基函数网 闭值的选取极其敏感。本文在此基础上提出了隐层优化算法, 络【J】.上海交通大学学报,2003,37(10):1641-1643. 通过修正隐层空间分布,减小模型对参数的依赖度,从而提 【4】蒋华刚,吴耿锋.基于人工免疫原理的RBF网络预测模型【J】. 高模型的预测性能和稳定性。在RBF神经网络预测模型中仍 计算机工程,2008,34(2):202—205. 有基函数宽度和输出权重等参数的计算方法有待优化,下一 【5】张敬磊,王晓原.基于非线性组合模型的交通流预测方法【J】. 步的工作是将待预测样本在隐层空间中的位置因素考虑进权 计算机工程,2010,36(5):202—204. 重计算中,针对不同的样本特性动态调整权重分配,以期提 [6】Hung Y H.A Neural Network Classiifer with Rough Set—based 高模型预测精度。 Feature Selection to Clsasify Multiclass IC Package Products[J[. 参考文献 Advanced Engineering nIformatics,2009,23(3):348—357. 【l】Whitehead B A.Cooperative Competitive Genetic Evolution of (7]韩丽,史丽萍,徐治皋.基于粗糙集理论的RBF神经网络剪枝 Radial Basis Function Centers and WidtllS Fortime Series Pie— 算法【J】.信息与控制,2007,36(5):604—609. diction[J[.IEEE Trans.on Neural Networks,1996,7(4):869—880. 【8】王耀南,张东波,黄辉先,等.粗糙集意义下的一种RBF神经网 络设计方法【J】.控制与决策,2007,22(10):1091-1096. 【2】Lu Yingwei,Sundararajan N,Saratchandran P.Performance 编辑顾姣健 Evaluation of Sequential Minimal Radial Basis Function(RBF) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top