搜索
您的当前位置:首页正文

第10卷第2期

来源:知库网
第10卷第2期2001年6月测绘工程                      ENGINEERING OF SURVEYING AND MAPPING2VoL 10,No.0TUN.,201测量数据的质量控制理论探讨欧吉冲(中国科学院测量与地球物理研究所.湖北武汉430077    摘要:从可赤性和粗差检剥两方面分析了质黄控制理论研究的进展;介绍了断的统一的可靠性指标,它完全由系眺的结构决定,不包含受主砚因素影响的概率因子(非中心参数场)。详细介绍了拟准检定法的原理和实施办涂,特别是初选拟准观洲的一些技巧,通过一个算例比较了拟准检定法与假设检脸的三种形式的计算姑果,后者存在郑分粗羞不能发现的问是,而前者能发砚全那粗差,效果校好。关扭甸:    质全控制;可命性;粗差检侧;拟准检定法巾.9&4:    P207文献标识码:A文章编号:1006-7949(2001)02-0006-05On the Theory about Quality Control Over Surveying DataOns            titute of Geodesy and Geophysics, Laboratoyor f Dynamical Geodesy,                    Chinese Academy ofSciences, Wuhan 430077, China)人bstraet: In this paper, the advance of research on the theorya bout quailyct ontorl is analyzed in twosides which consist of reliabiily tand detection of gross errors.  Anew and united index of reliabiily tisOUTr                                -kunintroduced.  This index is determined completely by the construction o#a system  (such二a surveyingnetwork), and not be necessaytr o include the probabiilyet lement (non-central parameter蝙)which isefected on饰some factorsc hosen subjectively.  The principle and a practised method of quasi-accuratedetection are discussed in detail, and some skills of selecting the quasi-accurate observatins at the frist stepate proposed.The results of the calculaiton of the quasi-accurate detection ae rcompared with those ofthe three models of hypothesis test师an example. It is shown that the hypothesis test may not detect alrgoss errorsbut  the quasi-accurate deteciton may do it easily.Key words: Quailyct ontrol; Reilabiilyt; Detection of gross errors; Quasi-accurate detection    二十世纪六十年代末,Baarda将概率及数理统计理论系统地引人测绘领域19,经过许多学者的努力,逐步形成了“可靠性理论”m和数据检测理论树,八十年代发展成测量数据的质量控制理论190三十年来,    粗差检测理论研究大多沿两种途径基础,测绘界Kubik,Caspay以及我国的周江文、r黄幼才、杨元喜等人都作了深人研究p9}hA假设检验虽然应用广泛,    但是在测量数据存在多个粗差时,效果不好。抗差M估计经多年发展,在减免粗差方面成为较有效的一种方法。它的关键是构造有效的权函数。然而目前构造通用的相关杭差权函数还存在较多困难。对于多维情形,还没有严密适用的精度评定方法。以往的数据检测方法都是以观测值的残差为    研究对象的。而经典最小二乘残差既受到观测值粗进行。一种是采用假设检验,如Baarda提出的DataSnooping得到广泛采用;还有Pope,Kok,Koch以及Chen等学者都作了深入探讨N X.nr。另一种是采用“抗差枯计”。数理统计界的HuberISl,Hampel以及Rousseeuw191奠定了广义极大似然估计(M估计)的鉴鬓易瞥一甜曹励A 1 k (49874006): W家.计划子课1(980119);'hA院资。与生,。究重点项目,52-s1-401);x+科院创新基金匡9900        .0-5)作者布介:欧吉坤(1947-)男,中国科学院侧星与地球物理研究所研究员博士导师。万方数据-----一一,,目甲,,,,,,,,,,,,..........., ̄一一-一第2期欧吉坤:浏1数据的质贵控制理论探讨差的影响又受到系统结构的制约,出现杠杆观测影响问题。对此,笔者近年提出一种检测粗差的新笔者建议一种新的可靠性指标151,即定义方法,mi伪拟准检定法。该方法以观测值的真误差Y;=(PR)4净。(4)为研究对象,通过一套独特的选择拟准观测的实施为系统在第i个观测位置的可靠性度量. Y;越大,办法,在阳加“拟准观测的真误差的范数极小”的条可靠性越好。件,求解庆于真误差的秩亏方程,根据真误差估值    笔者认为[314A凡是弃真概率ao ,检验功效民的分布特征来判别粗差、定位粗差,然后改正含粗和粗差个数b。的函数。a0I 民和b。一经选定,凡是差的观渊值,提高了参数拈计的准确度和精度。一个常数。在同一系统比较不同观测位置的可靠性1关子可市性理论的实质时,它不起作用。而且%、民和b。的选取一般根据经验,有一定主观性和任意性,因此不把Ao列人可通常,    把系统在一定的概率条件下,发现模型靠性指标会更客观、方便。误差(包括粗差和系统误差)月童的能力称为“内部可靠新的可靠性指标有如下特点:它的值域在【    0,性”。衡功内部可靠性的指标有两种:一种是以概率1]区间;既适合独立观测,也适合相关观测Y;中不R(检验效)可能探测出的最小边界误差(MDB),可以写成fsl含非中心参数,不仅计算简单,而且较为客观;但当I v,!=犷00 (PR广(1)观测值相关时,艺 y An-m其中,.to是非中心参数,00是先验单位权中误差,P是观测杖阵,明该测域*,统在该位置的内部可靠性越好,R是平差因子阵「'ono MDB值越小,z对假设检验和抗差枯计的认识对粗差说2.1关于假设检脸越敏感。    Baarda提出的Data Snooping方法采用了两条约定陈阎,一是先验单位权中误差au已知,其二是纲的指栩,值得注意的是,    不便于比较各观测位置的可靠性。为了{v}与所处方向有关,是有量模型(或系统)中只存在一个粗差。满足这两条的情进行比校,可以定义一个无量纲指标况下,统计量在零假设下服从标准正态分布。如果戈=AO            Pc/(PR)u              (2)是独立观测,统计量变得较简单其中,p‘来第‘个观测的权,指标A..越小,该观侧位w=ki       ll-oV'Q=1u; l/QO           (5)置的可靠耽L越好。其中,,‘是第£个观侧的最小二乘残差,Q.,是V定义外部可靠性为    的权逆阵的第1个元素,ra=卜l/。如果a.>KA        xj=Aopa/(PR)-AO=A,-A.      (3)二对(1,二,0),拒绝Ha,认为第‘个观测中含有粗表示在第i个观测的粗差对平差结果(x)的影响。差,这种检骏称为B一检验。这个值越沙,该位置的外部可靠性越好。事实卜,上述两条约定有时并不能满足。例如.    从式(    2),(3)可看到,定义内部和外部可靠性单位权中误差的先验值0o有时并不准确知道,于是是函数相ii的,两者的差值等于给定的常数A0 0一些学者提出替代B一法的检验方法。Pope 1976提当观比值相互独立时,    可靠性度量指标中起决定性作用的是平差因子阵R的对角元。由于葬 R;=出一种,一检验方法,采用单位权中误差的验后值子。。Heck 1981年提出了t-检验,采用几(i),即别除rt-。二(多余观测数),Rw常被称为“多余观测分第i个观测后由最小二乘估计得出的单位权中误量”。这种情况下,R。的值域是闭区间[[0,1],因此差估值。已经证明:一检验和t-检验是相互等价的。可以直接此较R‘的大小来评价各观测位置的可靠由于多个粗差的假设检验有一些困难,    荷兰的学者采用了两项关键措施:性,R。越太,系统在第i个观测位置的可靠性越好。1)采用迭代计算,    每一次迭代先进行整体检然而昌观测值相关时,  不能再用。多余观测分验,如果未通过,再进行一维检验,逐个挑选出统计量R..”来争价系统的可靠性。这时R;的值域已超量最大的与界值进行比较,超界的。认为该观测值越[0,1]山间,有的甚至取负值含有粗差;剔除后,再重复前面的步蕊.直到未发现下|||万方数据!万方数据测绘工程第to卷超界的为止。把抗差权函数和观测权有机结合,把抗差M估计2)约定整体检验与一维检验具有相同的功    化成为寻常的加权最小二乘形式。效,这意味着整体检验与一维检验将以同样大的概抗差估计的实施.    关键是选择恰当的极值函数率检测出粗差。实践证明上述方法存在两个问题:P(')或城"),周江文提出一种有界误差分布理论,(I)随着含粗差的观侧一个个被检测出来,    数依此可构造三段权函数(IGG方案)。我国学者还提据质量逐步改善,相应的检测标准应当更严格,但出了一些合理选取迭代初值,考虑系统结构,采用上述方法的界值K. (F,)却因粗差个数增多而呈现不同调制因子的多种抗差方案。杨元喜『川构造了相变大趋势,就是说随着数据质量变好,界值反而变关抗差极值函数,推导了相关抗差拈计解式。我国大,这是与检测粗差的宗旨相矛盾的。学者将抗差估计理论与经典LS估计有机结合,建(    2)每一步检验都要重新计算界值Ka(Fq),立了抗差最小二乘法理论1101。在实际工作中,抗差比较笨琐,不够经济。枯计也得到较好的应用。笔者针对上述方法存在的不足提出过一种改    然而抗差估计目前仍存在一些困难:    多维情形进算法,采用固定非中心参数,固定界值K. =F, ,的抗差估计理论还不完善;应用中,抗差极值函数以及以一维检验全部通过为准的措施。算例表明,p的选取虽然提出几十种,但还没有普通适用的,改进算法实施更方便,更经济,提高了检验功效。还缺少严密的精度估计评定和关系式。由于假设检验的统计量实质上仍是最小二乘    3拟准检定法的实施技巧平差的结果,因而其本身的抗差性能就较差,效果    笔者在深人研究已有方法的优点和不足基础不总是很好的,本文第4节将给出这方面的例子。上,提出一种全新的检测粗差的思路和方法,即拟2.2对侧f抗差估计的理解准检定法。它是以观测值的真误差为研究对象的。二乘估计不能抗拒粗差干扰的问题而发展起来的。    雄差枯计(Robust Estimation)是针对经典最小记R利(R=I-A (ATA A)一,A AT,R是平差因子矩阵,这里只数学象的贡献为抗差估计奠定了理论基础。近一、讨论单位权情况。容易推导d和L有确定的关系二十年,测量界的学者结合学科的特点,对抗差估Rd=-RL                               (10)计进行了深人的探讨。我们注意到,测量观测值大多数是正常的,只有少目前研究较多的是广义极大似然估计类的抗    数观侧值含有粗差,我们把那些基本正常但尚待确差估计(M估计)。针对测量问题,设线性化的观测认的观测称为“拟准观测”,而称含粗差的观测的观方程为测为“离群观测”。AX=T                  ,+d                 (6)假设选出了r(    >m)个拟准观侧,附加“拟准观其中,A是nx。维系数阵,X是待估参数向量,L测的真误差A的范数极小”的条件,可以由方程是观浏向量,d是真误差向量。周江文等将极小值(10)求得真误差的估值乙。问题表示成[121取。x  n维。矩阵‘Q=(0 A丁),其中二xr维矩Y,P,P(v,)=Y,Pip(可X-L; )=min (7)阵,T为系数,的转置阵中对应于这;个拟准观测的分块矩阵,可以解得对X录导并令之为0,2口l 月d艺Pt dP(v. ) _ } p,粤粤=YP 3   --sedX                   8X dX,W(v,)a,=0  (8)  六d    ‘其中.a}是系数阵A的列向量,P(')是选择的极值A的协因数阵 一}一‘一’・・-一 函数,w(")一般为P(')的函数,p‘为观测权。oJ  Qd 二=F双  RF r=(R+成GQ)一‘;(:+砚GQ)一,(12)如果令w(  it.)加:=tea(称权因子).P} Pew;(称等    可以证明141,由式(11)计算出的真误差的“拟价权!,则上述极值问题化成测量平差的常见形式准解”具有重要特性,即它能直接反映出粗差的位A'PV=O或ATPAX-ATPL-0          (9)置和大小。通常事先并不知道哪些观测是正常观测,因此    这就我国学者提出的等价权原理叫,通过等价权一一-- ̄甲一一一-一-一一 ̄--一-第2期欧吉坤:浏圣数据的质圣控制理论探讨如何正确选取拟准观测是拟准检定法的关键。我们一方面是介绍用拟准检定法以及假设检验三种方设计出分两个阶段选择拟准观测的实施方案:法检测粗差的过程和效果,另一方面起到相互对比)1    初选拟准观测的作用。设有多项式(    )1先计算标准化残差“二/(子V瓦),其中,‘是最小二乘残差,氏二emd卜‘},〔1月,…,。):几瓦弓气+4。二‘,一,4,‘,,,其中,马=l、,二、41,二‘仃刃,1,2,3)是待估的系数。2(    )将,写成。1二一;1一艺R;,l。一,根据有关模拟数值见表1。笋l                                      斑1健拟.妇和估位结果                  .aI}和}气}与哪d},{的关系,以及可靠性指标r=’二二一1二二二二1下N。弓  吟人!马+民P阮xR;。将观洲值分成4类:“’0类含粗差可能性大;“1”0幻35  仍5  020溉刀30  附类结构较握,可靠性弱;“3”类含粗差可能性不大,30  S帐一.500031一叫月其余为“2.类。010一(ns043一的弓025一一一不    3()根据观测值分类情况和。;值是否存在明其中5是正常误差,二是包含了粗差的真误差,显分界,可以初步选择“3”类以及“2’类中的“‘值7是模拟的粗差,共有4个,分布在观测值l(ti曰,小的为拟握观测(r)m+1)。8,13,14)中。)2    复扮拟准观侧)1    拟准检定法)l(    珠式(11)计算出真误差估值八,然后再计(1    )初选拟准观侧,由于1,和1.1结构差,归于算指标昨氏/c,,其中cl=1・843州一引,(=1,“1’,类,其余为“2”类;从表2的{%}栏看到}%1。}与!、{有明显差异,因此除1,,乙。和1.泊,之外,其余…,n)。均选为拟准观测,即取r=1仇)2(    依据3分群的特征,将那些j‘值明显较小,)2(  复选拟准观测,从云、栏以及平{栏可看到且对应的尸:值小于界值(一般取3刀或2.5)的观对应前4个观测的指标值明显大于其余观测的指测复选为率准观侧。代计算,司以确定拟准观测。经过增选或更换拟准观测的迭标值,因此仍选二10裹2  拟准检定法的结果在此幸础上,  计算出“。有粗差晤呈现明显的!  晰1NOr  12.813-13压4喇试  87肠  抽3.碑031」043一互1胡一压1肠分群现象。根据3的分群特征可以判别出粗差。计日13占2‘8侧一3212一6引】51313376[=一3r(/卜1])’“,如果衅140312五2  75157  算指标衅=或/q,cZA2222t25025,4    41_  R53102195510伽813    15%  大于预先绪定的界值(一般取3.52)、12134哪一6明】一1355个观侧含布粗差。)0,可以判定第,7乙0229007一659一t加34应当指出,    拟准检定法在初选拟准观测时虽然8856既哭5    一11翎62705二晰一576一1130也利用了牵小二乘残差的信息,但是它只是在初选犯26457既.  礴6,9扮    32时起一定参考作用,而起决定性作用的是真误差的61312004」88  及刃    11225222咖注肠  82    89}220423001姗一书1一1哎K】  拟准值压本身存在的分群特性。拟准雄定法的突出优点是:辨识粗差准确性    )3(  从最后求得的压‘及二犷可以判定11,1:,‘高;能同时仁位多个粗差。粗差越多,计算快捷的效和1.,含有粗差。果越明显。‘4(    )求得的粗差估值及参数估值牙和单位权中    研究表明,拟准检定法的思路仍然适用于相关观测的情律,只是在实施中要采用适当的措施。误差弓列在表1中,结果与模拟值很接近。    2)假设检验4算例分析本例分别进行了三种检验,    B一检验t一检验和T本算侧是基于文献L刊的算例改造后形成的。检验,有关结果见表3。万方数据j..J,.J勺.翎141礴浦JJ‘弓了,,J,!11、1万方数据测绘工程第to卷衰3假设检脸的结果第1次B一检验发现。:和。1    .均大于Kw,但[31欧吉冲数据检浏的若干理论与实戏[A].见:周江丈杭差t-检脸和T-检验均未发现粗差,将1a剔除后作第2佑计论文集[  C1.北京:刹绘th版社,1992.次检验,113, 11。和713均超界;剔除113后作第3次检[41 Teunission PJ.G.Quailyt contorl in geodesy networks [A] ,验,极测出11含有粗差;第4次检测未找到粗差。Gr  afarend E, Sanso F,(卜iuu ahon and design of geeditic因此总的看,    B一检验发现了4个粗差中的3ne  twodts[C] Berlin: Springer Verlag, 1984,526-547.个,卜检验和卜检验免强发现了2个粗差。[51欧吉冲.相关现侧价1R的可幸性研究[J1.刻绘学报.1999(3)    5结束语[61  Kok,J.On data snooping and multiple outher testing [R1NOAA   Technical Repotr NOS NGS 30,U.S. Department    研究数据质量控制理论不仅有重要科学意义,of   Commerce, Washington, D.C. 1985.而且有重大实用价值。质量控制理论应当包含系统[7] Chen, Y.Q.Kavouras, M. and Chrsanowski. A strategy-可纂性和数据检测两部分内容。叮靠性是系统的优f  or detection of outlying observations in measurements化诵计必须考虑的重要因素。反过来讲,可靠性指of   high precision[J]. 'Hre Candian Surveying,  1987,41标完全由系统的结构(R和P)确定。本文介绍的新(4):    529-540.可靠性指标,它既适于独立观测,也适于相关观测,[8] Huber, P.J.Robust Statistics[ M] New Yodrdohn Wiley&不含与主观因素有关的非中心参数]b,能客观反Sons,     1981.映系统结构的强度,另一方面系统的可靠性特征对[91 Hampel, F.R.Ronchetti, E.M-Rousseeuw, P.J. et. alRobus  t statiscics: The approach based on influence functions粗羞的检测也有影响,应当适当考虑。粗差检测除[  M]. New York:Wiley, 1986.受到系统结构因素的影响外,观测数据本身的质量1101周江文,黄幼才,扬元喜,等.杭关录小二来法[Ml武汉:起为键作用,情况复杂,需要有研究新思路。实践证华中理工大学出版社.    1997.明,拟准检定法是可行的,有突出的优点。fill场元喜.杭差佑计理论及其应用【M].北京:八一出版社,1993.    参考文献[12】周江文.经典误差理论与杭差估计MAN给学报,1989[1] B4arda, W.A testing procedure for use in geodetic networks,(2)    p  bblications on Geodesy  Q],New Serics,   Netherlands[131欧吉冲一种检at粗差的晰方法一拟准检定法[Jl.科学Gtode  ticConunission2(s), 1968.通报,    1999(16).[2]争德仁.谈差处理和可命性理论[MI.北京:侧绘III版社,[141欧吉冲论真误差拟准解的基本特性[Jl.浏绘通报,19991988.    (2).    

因篇幅问题不能全部显示,请点此查看更多更全内容

Top