基于相空间重构的汇率预测研究
王亚惠,谢维波
(华侨大学信息科学与工程学院,福建泉州362021)
摘 要:汇率在宏观经济政策、商业经营和个人决策制定上的作用越来越重要,使其成为了研究的热点。根据混沌动力系统的相空间延迟坐标重构理论,基于支持向量机的强大的非线性映射能力,提出了一种基于支持向量机回归的超短期汇率预测方法,并建立了模型,对美元港币的即时汇率进行了实证计算,且与BP神经网络模型进行了比较。结果表明,所建立的模型能很好地跟踪即时汇率的变化趋势,预测精度比较高且算法运行速度比BP神经网络模型快得多。关键词:超短期汇率预测;相空间重构;支持向量机;神经网络
中图分类号:TP18 文献标识码:A 文章编号:1673-629X(2008)05-0015-04
PredictionResearchofExchangeRateBasedonPhaseSpaceReconstruction
WANGYa2hui,XIEWei2bo
(InformationTechnologyandEngineeringCollegeofHuaqiaoUniversity,Quanzhou362021,China)
Abstract:Exchangerateishotspotsbecauseitbecomesmoreandmoreimportantinmacroeconomicpolicy,businessoperationandprivatedecision.Presentsanewmethod-supportvectormachines(SVM)forthepredictionofsupper-short-termexchangerate.ThemodelisestablishedforpredictingexchangerateofdollartoHongkongdollarandcomparedwiththeneuralnetworkpredictingmodel.There2sultshowsthatthemodelabovecantrackthesupper-short-termexchangerate’schangewell.Anditisbetterthantheneuralnetworkmodelatboththeaccuraterateandtherun-timelength.
Keywords:predictionofthesupper-short-termexchangerate;phasespacereconstruction;SVM;neuralnetwork
0 引 言
汇率在宏观经济政策、商业经营和个人决策制定上的作用越来越重要,这种重要性使汇率预测成为了国内外学者研究的热点。目前,汇率交易是全球全天
24小时通过网络进行的,不同时段的交易获利不同。
重视,并且已经广泛用于解决分类和回归问题。支持向量机的最大特点是它服从结构风险最小化原理而非经验风险最小化原理。研究发现支持向量机的各项性能尤其是泛化能力好于传统的人工神经网络。目前讨论较多的是支持向量机在模式识别方面的性能与应用,而在预测方面的应用研究还相对较少。
基于以上问题,将支持向量机回归原理应用于汇率预测,提出了一种适合超短期汇率预测的模型,模型所采用的输入向量通过相空间重构成技术得到。应用
SVM回归算法对美元港币的即时汇率数据进行仿真
因此,对企业经营和个人炒汇来说,汇率即时数据的跟踪是十分有意义的。神经网络[1]具有良好的逼近能力,是目前非线性系统研究的热门工具之一。但由于神经网络的结构过于复杂且难以选择,需要估计的参数相对于较少的数据样本显得太多,导致所得到的神经网络模型相对于数据容易产生过拟合,泛化能力不够,而使其预测精度不高,在短期汇率预测应用中受到了限制。Vapnik等人根据统计学习理论提出的支持向量机学习方法[2],近年来受到了国际学术界的广泛
收稿日期:2007-08-29
基金项目:福建省自然科学基金(A0540005)
作者简介:王亚惠(1982-),女,河北人,硕士研究生,研究方向为图像处理与模式识别;谢维波,硕士生导师,研究方向为信号处理、模式识别、智能信息处理。
计算,并将该算法与传统的BP神经网络预测算法进行比较,从而验证文中提出算法的有效性。
1 预测模型的建立
1.1 相空间重构技术
相空间重构的关键在于嵌入维数m和时滞τ的确定,对于给定的时间序列,应该存在一个最优的m和
[3]
τ。如果τ太小,则不能覆盖捕捉信号的动力学需要
的最小时间距,m将变得相当大;相反,如果τ大于最
计算机技术与发展 第18卷・16・
佳值,作为结果的模型的性质变得太离散,会导致捕捉不到信号的动力学性质。
Gautama[4]等人提出一个基于样本时间序列及其
越大对数据的拟合程度越高,但是SVM的复杂度也会
越大;ε称为管子尺度,它决定了对训练样本拟合的精确程度,ε值越大,支持向量数目就越少,因而解的表达就越稀疏。
3
为了寻找w和b需要引入松弛变量ξi和ξi,使下
替代数据的相空间的微熵率方法。同步确定τ和m。该方法主要的优点是用一个简单的测度同时优化m和τ,避免了分别求取m和τ引起的不一致性。该方法的物理意义明显,实际效果较好,故文中采用此方法估计这两个嵌入参数的最优值:mopt和τopt。
给定信号x(t)(t=1,2,…,N)的Ns个替代数据
xs,i(t),i=1,…,m,定义熵率(ER)为:mlnn)=I(m,τ)+Rent(m,τ
n)为其中:n是延迟矢量数;I(m,τ
)=I(m,τ
)H(x,m,τ)>i 123 (ξmin<(w,ξ,ξ)=‖w‖+c∑i+ξi)2i=1 3 N (6) 3 yi-(w・<(x))-b≤ε+ξi (1) s.t.(w,<(x))+b-yi≤ε+ξiξi3,ξi≥0 通过引入拉格朗日乘子ai和ai3,可以获得上式的对偶形式: max-N (2)而微熵H(x)=ρln(Nj)+ln2+CE,N是数据∑i=1 12 3 N ij=1 ∑(a Ni=1 i -i 3 ai)(aj-3-ai) 3 aj)K(xi,xj)- 长度,ρj是第j个延迟矢量与其最近邻点之间的欧氏距离,欧拉常数CE≈0.5772。熵率图上的最小值在m和τ轴上分别对应mopt和τopt;然后,重构相空间 X(k)=[x(k),x(k+τopt),…,x(k+(mopt- ε∑(ai+ai)+ N ∑y(a i (7) s.t. i=1 ∑(a 3 i 3 -ai)=0 i=1,2,…,N 1)τopt)] T (3) ai,ai∈[0,c] 其中K(xi,xj)=1.2 支持向量机回归件的任何对称的核函数对应于特征空间的点积。权值向量w为 N 设有训练样本集{(xi,yi)}iN=1,其中xi∈Rn,yi ∈R分别为输入值和对应的输出值,N为样本的个数,R和R分别为n维和1维实数空间。SVR采用如下的回归函数[5]: y=f(x)=(w・<(x))+b (4) )为内积运算,b为偏置项,<(x)是输入空间式中:(・ n w= i=1 ∑(a N i 3 -ai)xi 于是得回归函数f(x)的表达式为: f(x)= i=1 ∑(a i 3 -ai)K(xi,x)+b (8) 到高维特征空间的非线性映射,SVR就是将实际问题通过非线性映射转换到高维特征空间,并在这个空间中构造线性回归函数来实现原空间中的非线性回归函数,其特殊性质保证了SVR有较好的推广能力,同时也巧妙地解决了维数问题,使算法复杂程度与样本维数无关。系数w和b通过最小化下列泛函来估计: R(w)=c 从上面可以看出SVM回归算法在计算f(x)时,无需计算权值向量w和非线性映射<(x)的具体数值,而只需计算出拉格朗日乘子ai和ai3以及核函数 K(xi,xj)即可,从而巧妙地解决了维数灾难问题,使 得算法的复杂度与样本维数无关。同时通过选择合适的核函数,就可提高预测模型的精度,降低随机噪声对预测模型的影响。目前常用的函数主要有多项式函数、 RBF函数、Sigmoid函数等,文中选择的是RBF核函 1N N i=1 ∑e(f(x) i -yi)+ 12 (5)‖w‖ 2 )代表了经验风险,它通常用下式给出的ε不式中:e(・ 数: K(xi,xj)=exp(-‖xi-xj‖/2σ) 2 2 敏感损失函数来度量。 e(f(x)-y)= 其中σ为核函数的超参数,是预先选择的一个常数。 1.3 预测模型的建立过程 0, |f(x)-y|<ε |f(x)-y|-ε,|f(x)-y|≥ε 预测模型的建立过程如下[6]: (1)给定时间序列x(t)(t=1,2,…,N),利用1.1节的微熵率法求出mopt和τopt,重构相空间作为SVM 12 ‖w‖是正则化部分。通过控制c和ε两个参数,就2 可以控制SVM的泛化能力。c为平衡系数(也称惩罚系数),是正常数,用来平衡经验风险和正则化部分,c回归预测模型的输入矢量X(N×m维): X(t)=[x(t),x(t+τopt),…,x(t+(mopt- 第5期 王亚惠等:基于相空间重构的汇率预测研究・17・ 1)τopt)],t=1,2,…,N (t=1,2,…,对应的输出矢量为Y=x(t)′N)(N×1维)。 (2)用Cross-validation法选择核函数的超参数σ 预测结果如图3所示,可见所建立的模型能很好地跟踪即时汇率的变化趋势。为了说明SVM的预测效果,分别采用BP神经网络对美元港币即时汇率数据进行训练与预测。与支持向量机一样,把前500个数据样本用于训练,后16个数据样本作为预测效果检验样本,汇率真实值与BP神经网络预测值的对比如图4所示。 和调节参数c与ε的值。 (3)数据标准化处理:对输入向量X和输出向量Y 进行标准化处理: X(k,i)=Y(k)= X(k,i)-mean-x(i) std-x(i) Y(k)-mean-ystd-y k=1,2,…,N i=1,2,…,mopt 其中mean-x(i),std-x(i)分别是输入向量X的第i列的算术平均值和标准方差;mean-y和std-y分别是输出向量Y的算术平均值和标准方差。(4)对输入输出数据进行训练建立模型,即利用式(8)求解模型的参数。2 预测实例 文中的实验数据是从中国银行福建分行网页获取的实时数据[7],选取数据2006年5月26日13:55至 18:55的516条美元港币即时汇率(如图1所示),前500条数据用于建立预测模型,后16条数据用于模型 预测效果检验。采用微熵率方法求解时间序列的最优嵌入维数和最佳时滞。求得的熵率图如图2所示。求得的最优嵌入维数和最佳时滞为(2,6)。 图1 原始样本时间序列 在SVM预测模型中,取参数c=10,ε=0.001,核函数取为: 2 ‖xi-xj‖2 ),σK(xi,xj)=exp(-=0.752 2σ 输入矢量为: 为了更好地反映预测模型拟合效果和预测效果,对构建的模型采用以下统计量(其比较见表1): X(t)=[x(t),x(t+6)] t=1,2,…,N 计算机技术与发展 第18卷・18・ 平均绝对误差(MAE):MAE=均方差误差(MSE):MSE= ∑| N i ei| 超短期汇率预测的研究对汇率日常交易具有十分重要的意义。针对目前流行的神经网络预测模型不能适应超短期预测的要求,文中将支持向量机回归应用于即时汇率的预测中,获得了良好的拟合与预测精度。但是如何更加合理地选择各模型中的参数仍需进一步研 |ei|si ∑(e)2 N 均方根误差(RMSE):RMSE=平均相对误差(MAPE):MAPE= MSE1N ∑ 究。 参考文献: [1] MaguireLP,RocheB,McginnityTM.Predictingachaotic timeseriesusingafuzzyneuralnetwork[J].InformationSci2ences,1998,112:125-136.[2] VapnikVN.Thenatureofstatisticallearningtheory[M]. NewYork:Springer-Verlag,1995. [3] GrassbergerP,ProcacciaI.CharacterizationofStrangeAt2 tractors[J].PhysRevLet,1983,50(5):346-349. [4] GautamaT,MandicDP,VanhulleMM.Adifferentialen2 tropybasedmethodfordeterminingtheoptimalembeddingparametersofasignal[C]∥ProcoftheIntConfonaCous2tics,SpeechandSignalProcessing.HongKong:[s.n.],2003:29-32. [5] SchreiberT,SchmitzA.Surrogatetimeseries[J].PhysicaD, 2000,142(3-4):346-382. [6] 崔万照,朱长纯.混沌时间序列的支持向量机预测[J].物 算法运行时间RUNT:为预测算法开始到结束的时间间隔。 其中ei为汇率实际值与预测值的绝对误差,si为汇率实际值。i=1:16,N=16。 表1 各项性能指标比较 各项性能指标平均绝对误差(MAE)均方差误差(MSE)均方根误差(RMSE)平均相对误差(MAPE)算法运行时间RUNT BP神经网络6.8750e-0058.1250e-0099.0139e-0054.5280e-007 400s SVM回归5.0000e-0056.2500e-0097.9057e-0051.0062e-007 ≈1s 仿真结果表明,SVM回归算法的预测效果良好,能很好地跟踪即时汇率的变化趋势,预测精度高。与 BP神经网络相比SVM回归算法可以提供更好的泛化 能力,且运行速度要快的多。 理学报,2004(10):3303-3309. [7] 黄巧玲,谢维波.超短期汇率的预测研究[J].计算机应用, 2007(4):1009-1012. 3 结束语 汇率预测的研究一直是国内外学者研究的热点。 (上接第14页) 统计结果为2.1%,可以暂时不予处理。 3地名后缀问题。 如:珠海市尼科希电子有限公司→珠海//市尼科希//电子//有限公司。解决问题的办法是建立地名后缀库,如“市”、“区”、“省”、“镇”等加入库中。 北京:清华大学出版社,2005:193-196. [3] LaiBY,SunMS.Chinesewordsegmentationandpart-of -speechtagginginonestep[C]∥ProceedingsofInternation2alConference:ResearchonComputationalLinguistics.Taipei:[s.n.],1997:229-236. [4] 刘开瑛.中文文本自动分词和标注[M].北京:商务印书 馆,2000:4-10. 4 结 语 由于文中涉及切分需求的特殊性,目前的分词系统针对该领域分词效果不理想,所以文中定制了一个基于合并策略的未登录词识别方法,实验表明,在针对机构名切分这个特定领域,文中分词系统有更好的切分性能。另外,在一些短语类汉语切分中,该方法同样有效,前提是增加相关的关键词库 参考文献: [1] 吴 栋,滕育平.中文信息检索引擎中的分词与检索技术 [J].计算机应用,2004,24(7):128-131. [2] 朱巧明,李培峰,吴 娴,等.中文信息处理技术教程[M]. [9] [5] ChenKeh-jiann,ChenChao-jan.Knowledgeextractionfor identificationofChineseorganizationnames[C]∥Inproceed2ingofthe19thInternationalConferenceonComputationalLinguistics.Taipei:[s.n.],2002. [6] KnuthDE,MorrisJH,PrattVR.Fastpatternmatchingin strings[J].SIAMJournalonComputing,1977,6(2):323-350. [7] 张华平,刘 群.基于N-最短路径方法的中文词语粗分 。 模型[J].中文信息学报,2002,16(5):1-7. [8] 林碧英,赵 锐,陈良臣.基于Lucene的全文检索引擎研 究与应用[J].计算机技术与发展,2007,17(5):184-186.[9] 钟良伍.基于中文机构名简称的检索方法研究[D].北京: 清华大学信息科学技术学院,2005. 因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- zicool.com 版权所有 湘ICP备2023022495号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务