搜索
您的当前位置:首页正文

统计学例题

来源:知库网
第三节:平均误差的计算

例一:某班组有4名工人,甲、乙、丙、丁,基本工资分别为210元、220元、230元和240元,从中抽取2名工人,请计算以样本平均工资估计总平均工资的抽样平均误差。(1)若采用重复抽样,共有16个可能样本。(4名工人平均工资为225元)序号12345678910111213141516合计样本样本均值(甲,甲)210(甲,乙)215(甲,丙)220(甲,丁)225(乙,甲)215(乙,乙)220(乙,丙)225(乙,丁)230(丙,甲)220(丙,乙)225(丙,丙)230(丙,丁)235(丁,甲)225(丁,乙)230(丁,丙)235(丁,丁)240x-X-15-10-50-10-505-505100510150(x-X)222510025010025025250251000251002251000x(xX)K210007.9元16(2)若采用不重复抽样,共有12个可能样本。(4名工人平均工资为225元)序号123456789101112合计样本样本均值(甲,乙)215(甲,丙)220(甲,丁)225(乙,甲)215(乙,丙)225(乙,丁)230(丙,甲)220(丙,乙)225(丙,丁)235(丁,甲)225(丁,乙)230(丁,丙)235x-X-10-50-1005-501005100(x-X)2100250100025250100025100500x(xX)K25006.5元12例二某公司进口一批电子器件5000件,为了检测其寿命,抽取了500件进行检验,结果如下:寿命(千小时)8以下8-9器件数组中值(只)fxxf1505953230420345x2f11255057.53068544103967.5(xx)2f78.4167.230.13620707.58.59.510.511.5—9-1010-1111以上合计340403050041.62122.41309.8474045245(1)重复抽样和不重复抽样方式下电子器件平均寿命的抽样平均误差(2)如果寿命低于9000小时的产品是不合格品,计算不合格率的抽样平均误差。(1)电子器件平均寿命的抽样平均误差xf4740x9.48(千小时)f500xf45245Sx9.480.787(千小时)500f222重复抽样下:xnS0.7870.035(千小时)n500不重复抽样下:Sn0.78750011N5000n5000.033(千小时)x(2)不合格率的抽样平均误差n19018%不合格率:xpn500Spp(1p)Spn0.18(10.18)38.4%重复抽样下:pSpn0.3841.7%500不重复抽样下:p1n0.38450011.6%N5000500例三:随机(重复)抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?解:已知:n100,x58,10xn101100则:即:当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1公斤。例四:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?解:已知:N2000,n400,x4800,300x2n1nN3002400113.42(小时)4002000即:当根据样本灯泡的平均使用寿命估计全部灯泡的平均寿命时,抽样平均误差为13.42小时。例五:某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?已知:n400n180n180p20%则:样本成数n400pp1pn0.20.80.02400即:根据样本资料推断全部学生中戴眼镜的学生所占的比重时,推断的平均误差为2%。例六:一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格品率的抽样平均误差?已知:N60000n300n16则:样本合格率pnn130060.98n300pp1pn0.980.02300110.806(%)nN30060000即:根据样本资料推断总体合格品率时,推断的平均误差为0.806%。练习:某超市第三次购进福临门5升装食用油,抽取30瓶进行检验。经检验,这30瓶食用油的平均容量为4.99升,以往两批食用油容量的标准差为0.12升和0.10升。1、计算这次检验的抽样平均误差。2、按规定容量≥4.9升为合格,这30瓶食用油有2瓶不合格,计算这批食用油合格率的抽样平均误差。1、由于总体单位总数未知,因此采用重复抽样公式。又总体标准差未知,采用过去资料最大标准差作为估计值。0.12x0.0219(升)n302、合格率pSPn130293.3%n30p(1p)93.3%(193.3%)6.25%Spn6.25%1.14%30pn

第四节:区间估计例题

例一:要估计某批水稻种子的平均千粒重,现在随机在这批种子中抽取0.5千克,共有12500粒,折合每千粒重40克,如果确定极限误差范围为8克,这就要该批种子千粒重落在40+8克,即在32—48克之间。例二:要估计某农作物幼苗的成活率,从播种这一品种的幼苗中随机抽取幼苗1000株,其中死苗80株,则幼苗的成活率在92%,如果确实极限误差范围为5%,这就要求该农作物成活率P落在92%+5%,即87%-97%之间。例三当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(1μ);当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(2μ);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(3μ);在概率F(t)的保证下:xXxpPp即:全及平均数(成数)抽样平均数(成数)txxpp例四、某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。则:(1) x2nN10010000(2) 若以概率95.45%(t2)保证,该农场10000亩小麦的平均 亩产量的可能范围为:~402.38( Xxx40021.19397.62 千克)(1n)122(1100)1.19(千克)(3) 若以概率99.73%(t3)保证,该农场10000亩小麦的平均 亩产量的可能范围为:~403.57( X40031.19396.43 千克)例五:从某年级学生中按简单随机抽样方式抽取100名学生,对统计学的考试成绩进行检查,得知其平均分数为75.6分,样本标准差10分,试以95.45%(t=2)的概率保证程度推断全年级学生统计学成绩的区间范围。101001t2t2X(75.62,75.62)•所以,可以95.45%的可靠程度说,平均分的区间是[73.6,77.6]例六:当问起健康的成年人体温是多少时,多数人的回答是37度,这似乎已经成了一种共识。右边是一个研究人员测量的50个健康成年人的体温数据37.136.936.937.136.436.937.636.137.137.036.636.136.736.836.636.737.136.236.737.237.137.237.036.237.336.636.336.936.437.036.337.036.736.936.537.537.036.636.637.136.136.936.436.736.937.137.336.936.737.0请以95%(t=1.96)的概率保证程度推断健康成年人体温的的区间范围xx36.8ns(xx)n120.36s0.05nt1.960.050.098X(36.80.098,36.80.098)即X(36.7,36.9)因此,不应该再把37度作为正常人体温的一个有任何特定意义的概念例七:从某中学1万名学生中,随机抽取100名学生平均身高为160cm,学生身高的标准差为3cm。现要求可信度达到95.45%,试对全体学生平均身高进行区间估计。解已知:N=10000,n=1003,x160由Ft0.9545,得t21、计算抽样平均误差:p2n32100(1)0.31nN100100002、计算抽样极限误差xtx20.30.6cm3、计算总体平均数的置信区间上限:xx1600.6160.6cm下限:xx1600.6159.4cm即以95.45%的把握程度估计全体学生的平均身高的区间范围为159.4cm-160.6cm.例八:某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:p380400100%95%95%(195%)1.09%pP(1P)n400在概率95.45%的保证下,全及一级品率:Ppp95%21.09%~ 92.82% 97.18%例九:为调查农民生活状况,在某地区5000户农民中,按不重复简单随机抽样法,抽取400户进行调查,得知这400户中拥有彩色电视机的农户为87户。要求计算:以95%的把握程度估计该地区全部农户中拥有彩色电视机的农户在多大比例之间?解已知:N=5000n=400pn187Ft0.951、计算样本成数:n18721.75%n4002、计算抽样平均误差:pp1pn1nN0.21750.782540010.019840050003、计算抽样极限误差:ptp1.960.01980.03884、计算总体P的置信区间:下限:pp17.87%上限:pp25.63%即:以95%的把握程度估计该地区农户中拥有彩电的农户在17.87%至25.63%之间。例十:某公司为了解某新式时装的销路,在市场上随机对1600名成年人进行调查,结果有800名喜欢该时装,要求以95.45%(t=2)的概率保证程度,估计市场上成年人喜欢该新式时装比例的区间范围。80050%1600p(1p)0.50.51.25%n1600t2t2.5%P(50%2.5%,50%2.5%)p•所以,可以95.45%把握程度说区间范围为[47.5%,52.5%]

第六节:确定单位抽样数

例一:建筑工地打土方工人4000人,需测定平均每人工作量,要求误差范围不超过0.2M3,并需有99.73%保证程度。根据过去资料σ=1.5,求样本数应是多少?解: N4000,0.2,t3,1.5t22N32(1.5)24000 n2450(人)22222Nt(0.2)40003(1.5)1 若误差范围缩小(即0.1M3),保证程度不变232(1.5)24000 则 n1344(人)222(0.1)40003(1.5)例二:某金笔厂月产10000支金笔,以前多次抽样调查一等品率为90%,现在要求误差范围在2%之内,可靠程度达95.45%,问必须抽取多少单位数?解: N10000,P90%,p2% F(t)95.45% (t2) 在重复抽样条件下: n 在不重复抽样条件下: ntP(1-P)NpNtP(1-P)20.9(10.9)10000(0.02)1000020.9(10.9)222222tP(1-P)2p220.9(10.9)(0.02)22900(支) 825.7826(支)例三:某鞋厂对某种类型的鞋子进行耐穿时间的抽样检验,经过二次小型抽样检验,结果知道标准差是18天与20天,试问在抽样误差不超过1天(概率为0.9011)的要求下,至少应抽查多少双鞋子?已知:解:1182201t1.6521应取2t2221.652202n2400(双)21.65即至少应抽查400双鞋子例四某公司对第一批次新产品的使用寿命进行测试,随机抽取了200个产品,测得其平均寿命为2800小时,标准差100小时。1)以95%的可靠程度估计这批次新产品的平均使用寿命;2)假如有需要采用相同方法对第二批次相同产品进行抽样检查,要求误差不超过12小时,概率保证程度为95%,则最少应该抽取多少个产品进行测试?1)xnS1007.07(小时)n200xtx1.967.0713.86(小时)在95%的概率保证程度下,这批新产品的置信区间为(2800-13.86,2800+13.86)=(2786.14,2813.86)小时。2)x12(小时)t221.9621002n2266.8(个)212在95%的可靠程度,至少需要抽取267个产品,才能满足可靠性和准确度要求。练习某研究人员想从2012年第一学期开始跟踪了解郑州高校在校学生每周的自习时间,他计划采用抽样调查方式。2007年第一学期开始调查,设定这次调查结论可靠程度为95.45%,误差不超过0.5小时。1、2012年第一学期至少需要调查多少学生?调查后得到被调查学生每周平均自习时间为10小时,方差为8小时,那么自习时间的置信区间为多少?2、此后每个学期该研究人员对相同样本学生进行跟踪调查,2012年第二学期自习时间的标准差为8.2小时,2013年第一学期自习时间的标准差为9.3小时。2013年第二学期,每周平均自习时间为9.6小时,计算95.45%概率保证程度下,该次调查每周自习时间的置信区间。t2222821、n21024(人)20.5在95.45%概率保证程度下,每周自习时间的置信区间为(10-0.5,100.5)(9.5,10.5)小时。2、xx9.30.29(小时)n1024tx20.290.58(小时)在95.45%概率保证程度下,这次调查的每周自习时间的置信区间为(9.02,10.18)小时。例:某市开展职工家庭调查,根据历史资料该市职工家庭平均每人年收入的标准差为250元,恩格尔系数为65%。现在用重复抽样的方法,要求在95.45%的概率保证下,平均收入的极限误差不超过20元,恩格尔系数的极限误差不超过4%,求样本必要的单位数。样本平均数的必要单位数为:t22222502n2625户2x20样本成数的必要单位数为:t2p(1p)220.650.35n569户22p0.04应采用比较多的单位数,即抽取625户家庭进行调查,以满足共同的要求。

因篇幅问题不能全部显示,请点此查看更多更全内容

Top