试题(A)参考答案
一、试述标准差与标准误的区别和联系 答:区别:
⑴意义:标准差是描述数据分布离散程度的指标;标准误是样本统计量的标准差。 ⑵公式:S概率事件的标准;P的含义是指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率,即抽样误差的概率。将获得的概率P与检验水准进行比较可得出结论。本例0.05,
P0.0010.05,拒绝H0,接受H1,结论具有统
计学意义,可以认为不同或不等。
四、研究人员调查了2005年某社区全部居民的全死因死
(XX)2;
SS n1Xn(2分)
⑶用途:标准差①用于表示数据离散程度的大小;
②也可用于计算变异系数、估计频数分布、制定参考值范围、进行质量控制;③很多统计处理方法中要用到标准差。
标准误①用于反映抽样误差的大小;②计算总体均
数的可信区间;③统计处理方法的基础,如t检验。联系:标准误与标准差成正比;若标准差固定不变,可通过增加样本含量来减少抽样误差。
二、请以完全随机设计为例说明方差分析的基本思想 答:方差分析的基本思想就是把全部观察值间的变异----总变异按设计和需要分解成两个或多个组成部分,产生每部分变异的来源可能不同,比较各部分变异的大小。在完全随机设计资料的方差分析中,是把总变异分解为组间变异和和组内变异:SS总分解为SS组间和SS组内;
总分解为组间和组内,得组间变异和组内变异分别
为MS组间=
SS组间SS组内和MS组内=
组间,若各组的来
组内自同一总体,则各组间的变异与组内变异一样,均由随机误差所致,MS组间=MS组内,F值(FMS组间MS)
组内服从F分布,查F界值表得到相应的P值,然后根据所取的检验水准做出推断结论。答案难以统一,只要基本意思表达正确,均应给分,阅卷时需灵活掌握,注意把握尺度。
三、在某次假设检验中,检验水准为0.05,所得的
概率为P0.001,请就本例分别说明和P
的意义?答:称检验水准,是预先给定的概率值,它确定了小
亡及恶性肿瘤死亡人数(见表1),根据该资料可以得出哪些统计信息?
答:可以得到以下统计信息:各年龄组人口构成比、各
年龄组全死因构成比、恶性肿瘤死因构成比和各年龄组恶性肿瘤死亡构成比、粗死亡率和年龄别死亡率、恶性肿瘤死亡率和年龄别恶性肿瘤死亡率。(不要求:肿瘤后的死亡人数占全死因死亡人数的比例、全死因寿命表死亡概率、全死因寿命表生存概率、去肿瘤死亡后的生存概率、去肿瘤死亡后的尚存人数、去肿瘤死亡后的死亡人数、去肿瘤死亡后的生存人年数、去肿瘤死亡后的生存总人年数、去肿瘤死亡后各年龄尚存者的平均预期寿命。)
五、请解释多元线性回归分析中R2
和sy123m的统计学
意义。
答:R2
为决定系数,其意义是回归平方和SS回归占总离
均差平方和SS总的比例,用R2
可定量评价在
y的总变
异中,由x变量组建立的线性回归方程所能解释的比例。
sy123m为剩余标准差,可以说明估计值的精确度,剩
余标准差越小,表示回归方程的估计精度越高。 六、什么是随访资料中的截尾值?出现的原因有哪些? 答:由于某种原因使得部分病人不能随访到底,称之为截尾,从起点至截尾点所经历的时间称为截尾值。出现截尾值的原因主要有随访对象失访、治疗措施改变、研究工作结束时事件尚未发生等情况。
七、研究五种类型的军装在两种环境、两种活动状态下着装战士的主观热感觉(用评分表示),且需要进行全搭
配实验,应采用何种设计?需安排几个实验组?请写出设计方案。
答:应采用2×2析因设计,需安排4个实验组。具体设
计方案如下:
环境1 环境2
状态1 1 2 3 4 5 1 2 3 4 5
状态2 1 2 3 4 5 1 2 3 4 5
2(adbc)2n(386*322895*65)2*166826.80(ab)(cd)(ac)(bd)1281*387*451*1217
(2)u检验:
up1p211pc(1pc)()n1n20.30130.1680110.2704(10.2704)()12813875.17八、今测得101名30~49岁正常成年男子的血清总胆固醇(表2)。据此资料进行全面的统计分析。(10分) 答:⑴由频数表可看出,资料近似服从正态分布,可用
⑶确定P值,作出推断结论
均数和标准差描述其集中趋势和离散趋势。
XfXf4.74,
fX(fX)22Sff10.8816
⑵制定95%参考值范围:
X1.96S4.741.96*0.8816(3.0071,6.4631) ⑶估计总体均数的可信区间:n=101>50
XuS2n4.741.960.8816101(4.5632,4.9071)九、为了比较工人和农民的高血压患病率,随机调查了50~59岁的男性工人1281人,其中高血压患者386人;又随机调查了50~59岁的男性农民387人,其中高血压患者65人。问工人与农民的高血压患病率是否相同? 答:首先将资料整理成下表形式:
是否患高血压 是 否 合计 工人 386 895 1281 农民 65 322 387 合计
451
1217
1668
1.建立检验假设,确定检验水准
H0:12,工人与农民的高血压患病率相同 H0:12,工人与农民的高血压患病率不同
0.05
2.选定检验方法,计算检验统计量(可选用下列两种方法之一): (1)2检验:
226.803.84,
(或u5.171.96),所以P<0.05。拒绝H0,接受H1,可以认为工人和农民的高血压患病率不同。
十、今测得10名男20岁男青年的身高与前臂长(表3),问二者有无线性相关关系,若有相关关系,其相关关系的密切程度及方向如何。(10分) ⑴作散点图(略) ⑵求相关系数
X1725,Y454,XY78541,X2298525,Y220690
lxy78541454*172510226,
17252lxx29852510962.5,
l206904542yy1078.4
rlxyl226xxlyy78.4*962.50.8227
⑶相关系数的假设检验 ①H0:0,两变量间无线性相关关系
H1:0,两变量间有线性相关关系
0.05
②
tr.82
1r2010.8224.05 n28③t1.860,所以P <0.05,拒绝H0,接受H1,可
以认为两变量间存在线性相关关系,并且呈正相关,即身高越长,前臂长越长。
因篇幅问题不能全部显示,请点此查看更多更全内容