【实验目的】
掌握一元线性、非线性回归模型的建模方法 【实验内容】
建立我国税收预测模型 【实验步骤】
【例1】建立我国税收预测模型。表1列出了我国1985-1998年间税收收入Y和国内生产总值(GDP)x的时间序列数据,请利用统计软件Eviews建立一元线性回归模型。
表1 我国税收与GDP统计资料 年份 1985 1986 1987 1988 1989 1990 1991 税收 2041 2091 2140 2391 2727 2822 2990 GDP 8964 10202 11963 14928 16909 18548 21618 年份 1992 1993 1994 1995 1996 1997 1998 税收 3297 4255 5127 6038 6910 8234 9263 GDP 26638 34634 46759 58478 67885 74463 79396 一、建立工作文件
⒈菜单方式
在录入和分析数据之前,应先创建一个工作文件(Workfile)。启动Eviews软件之后,在主菜单上依次点击File\\New\\Workfile(菜单选择方式如图1所示),将弹出一个对话框(如图2所示)。用户可以选择数据的时间频率(Frequency)、起始期和终止期。
图1 Eviews菜单方式创建工作文件示意图
1
图2 工作文件定义对话框
本例中选择时间频率为Annual(年度数据),在起始栏和终止栏分别输入相应的日期85和98。然后点击OK,在Eviews软件的主显示窗口将显示相应的工作文件窗口(如图3所示)。
图3 Eviews工作文件窗口
一个新建的工作文件窗口内只有2个对象(Object),分别为c(系数向量)和resid(残差)。它们当前的取值分别是0和NA(空值)。可以通过鼠标左键双击对象名打开该对象查看其数据,也可以用相同的方法查看工作文件窗口中其它对象的数值。
⒉命令方式
还可以用输入命令的方式建立工作文件。在Eviews软件的命令窗口中直接键入CREATE命令,其格式为:
CREATE 时间频率类型 起始期 终止期
本例应为:CREATE A 85 98 二、输入数据
在Eviews软件的命令窗口中键入数据输入/编辑命令:
DATA Y X
此时将显示一个数组窗口(如图4所示),即可以输入每个变量的数值
2
图4 Eviews数组窗口
三、图形分析
借助图形分析可以直观地观察经济变量的变动规律和相关关系,以便合理地确定模型的数学形式。 ⒈趋势图分析
命令格式:PLOT 变量1 变量2 ……变量K 作用:⑴分析经济变量的发展变化趋势
⑵观察是否存在异常值 本例为:PLOT Y X ⒉相关图分析
命令格式:SCAT 变量1 变量2 作用:⑴观察变量之间的相关程度
⑵观察变量之间的相关类型,即为线性相关还是曲线相关,曲线相关时大致是哪
种类型的曲线
说明:⑴SCAT命令中,第一个变量为横轴变量,一般取为解释变量;第二个变量为纵轴变量,一般取为被解释变量
⑵SCAT命令每次只能显示两个变量之间的相关图,若模型中含有多个解释变
量,可以逐个进行分析
⑶通过改变图形的类型,可以将趋势图转变为相关图 本例为:SCAT Y X
图5 税收与GDP趋势图
图5、图6分别是我国税收与GDP时间序列趋势图和相关图分析结果。两变量趋势图
3
分析结果显示,我国税收收入与GDP二者存在差距逐渐增大的增长趋势。相关图分析显示,我国税收收入增长与GDP密切相关,二者为非线性的曲线相关关系。
图6 税收与GDP相关图
三、估计线性回归模型
在数组窗口中点击Proc\\Make Equation,如果不需要重新确定方程中的变量或调整样本区间,可以直接点击OK进行估计。也可以在Eviews主窗口中点击Quick\\Estimate Equation,在弹出的方程设定框(图7)内输入模型:
Y C X 或 YC(1)C(2)X
图7 方程设定对话框
还可以通过在Eviews命令窗口中键入LS命令来估计模型,其命令格式为:
LS 被解释变量 C 解释变量
系统将弹出一个窗口来显示有关估计结果(如图8所示)。因此,我国税收模型的估计式为:
ˆ987.540.0946x y这个估计结果表明,GDP每增长1亿元,我国税收收入将增加0.09646亿元。
4
图8 我国税收预测模型的输出结果
五、估计非线性回归模型
由相关图分析可知,变量之间是非线性的曲线相关关系。因此,可初步将模型设定为指数函数模型、对数模型和二次函数模型并分别进行估计。
在Eviews命令窗口中分别键入以下命令命令来估计模型:
双对数函数模型:LS log(Y) C log(X) 对数函数模型:LS Y C log(X) 指数函数模型:LS log(Y) C X 二次函数模型:LS Y C X X^2
还可以采取菜单方式,在上述已经估计过的线性方程窗口中点击Estimate项,然后在弹出的方程定义窗口中依次输入上述模型(方法通线性方程的估计),其估计结果显示如图9、图10、图11图、12所示。
ˆ1.27040.6823lnx 双对数模型:lny(3.8305) (21.0487)
R20.9736 R20.971 4 F443.05
对数模型:
ˆ26163y.322985.92lnx
(-8.3066) (9.6999)
R20.8869 R20.877 5 F94.0875
ˆ7.50862.0710x 指数模型:lny(231.7463) (27.2685)
5R20.9841 R20.982 8 F743.57
ˆ1645二次函数模型:y.70.0468x5.5810x
(7.4918) (3.3422) (3.4806)
72R20.9918 R20.990 3 F661.78
5
图9 双对数模型回归结果
图10 对数模型回归结果
图11 指数模型回归结果
6
图12 二次函数模型回归结果
六、模型比较
四个模型的经济意义都比较合理,解释变量也都通过了T检验。但是从模型的拟合优度来看,二次函数模型的R值最大,其次为指数函数模型。因此,对这两个模型再做进一步比较。
在回归方程(以二次函数模型为例)窗口中点击View\\Actual,Fitted,Residual\\ Actual,Fitted,Residual Table(如图13),可以得到相应的残差分布表。
2
图13 回归方程残差分析菜单
上述两个回归模型的残差分别表分别如下(图14、图15)。比较两表可以发现,虽然二次函数模型总拟合误差较小,但其近期误差却比指数函数模型大。所以,如果所建立的模型是用于经济预测,则指数函数模型更加适合。
7
图14 二次函数回归模型残差分别表
图15 指数函数模型残差分布表
8
练习题
1.下表是中国2007年各地区税收Y和国内生产总值GDP的统计资料。
单位:亿元
地区 北 京 天 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 Y 1435.7 438.4 618.3 430.5 347.9 815.7 237.4 335.0 1975.5 1894.8 1535.4 401.9 594.0 281.9 1308.4 625.0 GDP 地区 Y 434.0 410.7 2415.5 282.7 88.0 294.5 629.0 211.9 378.6 11.7 355.5 142.1 43.3 58.8 220.6 GDP 9230.7 9200.0 31084.4 5955.7 1223.3 4122.5 10505.3 2741.9 4741.3 342.2 5465.8 2702.4 783.6 889.2 3523.2
9353.3 湖 北 5050.4 湖 南 13709.5 广 东 5733.4 广 西 6091.1 海 南 11023.5 重 庆 5284.7 四 川 7065.0 贵 州 12188.9 云 南 25741.2 西 藏 18780.4 陕 西 7364.2 甘 肃 9249.1 青 海 5500.3 宁 夏 25965.9 新 疆 15012.5 要求,运用Eviews软件:
(1) 作出散点图,建立税收随国内生产总值GDP变化的一元线性回归方程,并解释斜率的
经济意义;
(2) 对所建立的回归方程进行检验;
(3) 若2008年某地区国内生产总值为8500亿元,求该地区税收收入的预测值及预测区间。 2. 为了研究深圳市地方预算内财政收入与国内生产总值的关系,得到以下数据: 年 份 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 地方预算内财政收入Y (亿元) 21.7037 27.3291 42.9599 67.2507 74.3992 88.0174 131.7490 144.7709 164.9067 184.7908 225.0212 265.6532 国内生产总值(GDP)X (亿元) 171.6665 236.6630 317.3194 449.2889 615.1933 795.6950 950.0446 1130.0133 1289.0190 1436.0267 1665.4652 1954.6539 9
资料来源:《深圳统计年鉴2002》,中国统计出版社
(1)建立深圳地方预算内财政收入对GDP的回归模型; (2)估计所建立模型的参数,解释斜率系数的经济意义; (3)对回归结果进行检验;
(4)若是2005年年的国内生产总值为3600亿元,确定2005年财政收入的预测值和预 测区间(0.05)。
3. 表中是16支公益股票某年的每股帐面价值和当年红利: 公司序号 1 2 3 4 5 6 7 8 帐面价值(元) 22.44 20.89 22.09 14.48 20.73 19.25 20.37 26.43 红利(元) 公司序号 2.4 2.98 2.06 1.09 1.96 1.55 2.16 1.60 9 10 11 12 13 14 15 16 帐面价值(元) 12.14 23.31 16.23 0.56 0.84 18.05 12.45 11.33 红利(元) 0.80 1.94 3.00 0.28 0.84 1.80 1.21 1.07 根据上表资料:
(1)建立每股帐面价值和当年红利的回归方程; (2)解释回归系数的经济意义;
(3)若序号为6的公司的股票每股帐面价值增加1元,估计当年红利可能为多少?
4. 美国各航空公司业绩的统计数据公布在《华尔街日报1999年年鉴》(The Wall Street Journal Almanac 1999)上。航班正点到达的比率和每10万名乘客投诉的次数的数据如下1。 航空公司名称 西南(Southwest)航空公司 大陆(Continental)航空公司 西北(Northwest)航空公司 美国(US Airways)航空公司 联合(United)航空公司 美洲(American)航空公司 德尔塔(Delta)航空公司 美国西部(Americawest)航空公司 环球(TWA)航空公司 航班正点率(%) 81.8 76.6 76.6 75.7 73.8 72.2 71.2 70.8 68.5 投诉率(次/10万名乘客) 0.21 0.58 0.85 0.68 0.74 0.93 0.72 1.22 1.25 (1)画出这些数据的散点图
(2)根据散点图。表明二变量之间存在什么关系?
(3)求出描述投诉率是如何依赖航班按时到达正点率的估计的回归方程。 1
资料来源:(美)David R.Anderson等《商务与经济统计》,第405页,机械工业出版社
10
(4)对估计的回归方程的斜率作出解释。
(5)如果航班按时到达的正点率为80%,估计每10万名乘客投诉的次数是多少?
5. 研究青春发育与远视率(对数视力)的变化关系,测得结果如下表: 年龄(岁)x 6 7 8 9 10 11 12 13 14 15 16 17 18 远视率(%)y 63.64 61.06 38.84 13.75 14.50 8.07 4.41 2.27 2.09 1.02 2.51 3.12 2.98 对数视力Y=lny 4.153 4.112 3.659 2.621 2.674 2.088 1.484 0.82 0.737 0.02 0.92 1.138 1.092 ˆ= lna+bx)并进行计量分析。 ˆ=aebx(Y试建立曲线回归方程y
6. 为研究美国软饮料公司的广告费用X与销售数量Y的关系,分析七种主要品牌软饮料公司的有关数据2(见下表)
美国软饮料公司广告费用与销售数量 品牌名称 Coca-Cola Classic Pepsi-Cola Diet-Coke Sprite Dr.Pepper Moutain Dew 7-Up 广告费用X(百万美元) 131.3 92.4 60.4 55.7 40.2 29.0 11.6 销售数量Y(百万箱) 1929.2 1384.6 811.4 541.5 546.9 535.6 219.5 分析广告费用对美国软饮料工销售影响的数量关系。
7. 表中是中国1978年-1997年的财政收入Y和国内生产总值X的数据:
中国国内生产总值及财政收入 单位:亿元
年 份 1978 1979 国内生产总值X 3624.1 4038.2 财政收入Y 1132.26 1146.38 2
资料来源:(美)David R.Anderson等《商务与经济统计》,第405页,机械工业出版社
11
1980 1081 1082 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1006 1997 数据来源:《中国统计年鉴》 试根据这些数据完成下列问题;
4517.8 4860.3 5301.8 5957.4 7206.7 8989.1 10201.4 11954.5 14992.3 16917.8 18598.4 21662.5 26651.9 34560.5 46670.0 57494.9 66850.5 73452.5 1159.93 1175.79 1212.33 1366.95 1642.86 2004.82 2122.01 2199.35 2357.24 2664.90 2937.10 3149.48 3483.37 4348.95 5218.10 6242.20 7407.99 8651.14 (1)建立财政收入对国内生产总值的简单线性回归模型,并解释斜率系数的经济意义; (2)估计所建立模型的参数,并对回归结果进行检验;
(3)若是1998年的国内生产总值为78017.8亿元,确定1998年财政收入的预测值和预测区间(0.05)。
12
因篇幅问题不能全部显示,请点此查看更多更全内容