承 诺 书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。
我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。
我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 10 日
赛区评阅编号(由赛区组委会评阅前进行编号):
2012高教社杯全国大学生数学建模竞赛
编 号 专 用 页
赛区评阅编号(由赛区组委会评阅前进行编号): 赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号):
葡萄酒的评价方法研究
摘要
在本文中,我们分析葡萄酒和酿酒葡萄的理化指标与所酿的葡萄酒的质量之间的关系,研究能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。
针对问题一,本文分析了所给附件1中两组评酒员对不同葡萄酒样品的评价结果,运用方差分析法来分析两组评价结果差异的显着性。在显着性水平取为0.05的情况下,发现两组评价结果的均值和方差均满足齐性,即两组评酒员的评价结果没有显着性差异。因无显着差异,本文把两组评酒员的评分的总均值作为葡萄酒评分的期望值,计算两组评酒员对于各酒样品评分的方差并求和,结果显示第二组的总方差明显小于第一组,即其评分稳定性更高,得出第二组的评价结果更可信。
针对问题二,本文借助问题一中第二组的评价结果,将葡萄酒的质量数量化。运用主成分分析方法,得出酿酒葡萄的主要理化指标,在此基础上运用相关性分析法,分析了酿酒葡萄的主要理化指标和葡萄酒质量的相关程度,将酿酒葡萄的主要理化指标的加权平均值作为葡萄分级的标准,其中权重取为理化指标的相关系数。把各葡萄样品的主要理化指标代入表达式,得到最终加权平均值,对其划分级别,并作为葡萄的级别。结果显示红葡萄样品集中在第2,3,4级,而白葡萄大多数集中在第2级(级别数值越小代表葡萄质量越好)。
针对问题三,本文依据问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,分析了葡萄酒的理化指标与酿酒葡萄的主要理化指标之间的相关程度,我们得到的主要结论为:红葡萄酒中的花色苷与酿酒葡萄中的DPPH自由基、褐变度显着相关,与酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关;白葡萄酒中的单宁与酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关。
针对问题四,考虑到除葡萄与葡萄酒的理化指标外,葡萄与葡萄酒的芳香物质可能对葡萄质量也会造成影响。首先,运用主成分分析法,得出芳香物质中的主要成分,并借助问题二中所得的酿酒葡萄的主要理化指标,运用相关性分析法,综合分析了葡萄酒质量受酿酒葡萄和葡萄酒的理化指标、酿酒葡萄和葡萄酒中的芳香物质的影响程度。根据所得结果,取与葡萄酒质量关联程度较大的因素作为自变量,以葡萄酒质量作为因变量,运用多元线性回归模型建立相应的函数关系。通过上述定性与定量分析,说明葡萄酒的质量受葡萄和葡萄酒中芳香物质的影响,因此不能仅以葡萄和葡萄酒的理化指标判别葡萄酒的质量。
以上结果具有较高的可靠性和可行性,对于葡萄酒的评价具有一定的指导意义。
关键词:葡萄酒质量 理化指标 方差分析 主成分分析 多元线性回归 相关性分析
一:问题重述
葡萄酒质量的一般是通过一批有资质的评酒员的品评来确定的。他们对葡萄酒进行品尝后对其分类指标打分,然后求和得到总分,从而确定其质量。葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量,酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系。
根据所给相关资料,建立数学模型讨论如下的问题:
1:分析附件1中的两组评酒员的评价结果有无显着差异并分析哪组的结果更可靠。 2:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3:分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
二:模型假设
1. 假设各评酒员进行评分时,公正客观的对各酒样品的进行评分。 2. 假设各评酒员对不同酒样品的评价结果服从正态分布。
3. 假设进行方差分析时,各评酒员对不同酒样品的评价结果互不干扰,相互独立。 4. 假设问题四中,除葡萄和葡萄酒的理化指标外,仅有芳香物质对葡萄酒的质量产生影响。
三:符号说明
SSw…………………………随机误差 SSt…………………………总偏差平方和
SSb……………………………组间平方和 dfb……………………………组内自由度 xi………………………………平均数 n………………………………样本总数 ………………………………显着性水平 m………………………………组数
Fi………………………………第i类主成分
MSw MSb……………………均方根
Sx1x2………………………………均数差异标准误差 S12 S22……………………………样本方差 aij………………………………主成分系数
p………………………………第p个观测量
A………………………………主成分系数矩阵 R………………………………相关系数矩阵
xij……………………………第j个评酒员对第i种酒样品的评分
01,,…,p…………………p1个未知参数 ………………………………不可测随机误差 cov(x,y)………………………x,y的协方差 D(x),D(y)……………………x,y的方差
………………………………相关系数
ai………………………………红葡萄酒质量相关的各因素的系数 bi………………………………白葡萄酒质量相关的各因素的系数
四:模型的建立与求解
问题一:两组评酒员评价结果的差异分析——方差分析法
针对问题一,本文首先查阅相关资料,给出关于显着性差异的解释:
显着性差异是一个统计学名词,它是统计学上对数据差异性的评价。当数据之间具有了显着性差异,就说明参与比对的数据是来自于具有差异的两个不同总体,对于显着性差异的检验通常采用方差分析法[1]。
根据附件1所给的葡萄酒品尝评分表,本文采用方差分析法来分析两组评价员评价结果的差异性。方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法[2],运用方差分析法各样本必须符合以下条件: (1)样本是相互独立的随机样本; (2)各样本来自正态总体;
方差分析认为不同处理组的均值间的差别基本来源有两个:
(1)随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示, 记作SSw,组内自由度dfw (2)实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和表示,记作SSb,组间自由度dfb (3)总偏差平方和SSt的公式 其中 所以
上式中,n(xi.x..)2为各处理平均数xi.与总平均数x..的离均差平方和与重复数
i1kn的乘积,反映了重复n次的组间变异,称为组间平方和,记为SSb,即
上式中,(xijxi.)2为各组内均差平方和之和,反映了各组内的变异即误差,
i1j1kn称为组内平方和或误差平方和,记为SSw,即
于是有
这个关系式中三种平方和的简便计算公式如下:
组内SSw、组间SSb除以各自的自由度(组内dfwnm,组间dfbm1,其中n为样本总数,m为组数),得到其均方MSw和MSb,一种情况是处理没有作用,即各组样本均来自同一总体,MSbMSw1。另一种情况是处理确实有作用,那么,
MSb?MSw(远远大于)。MSbMSw构成F分布,用F值与其临界值比较,推断各样本是否来自相同的总体。
(4)方差分析的假设检验:
零假设H0:m组样本均值都相同,即12Lm,如果经过计算结果组间均方远远大于组内均方(MSb?MSw),FF0.05(dfb,dfw),0.05,拒绝零假设, 说明样
本来自不同的正态总体,说明处理造成均值的显着差异;否则FF0.05(dfb,dfw),
0.05,不能拒绝零假设,说明样本来自相同的正态总体,处理间无差异。其中为
显着性水平。
本文对于不同的酒样本方差检验结果如下:
表1 各红葡萄酒样品的方差分析结果 红葡萄酒 1 2 3 4 5 6 7 样品 0.31 0.100 1.00 0.684 0.613 0.793 0.335 4 红葡萄酒 10 11 12 13 14 15 16 样品 0.30 0.423 0.391 0.852 0.558 0.320 1.00 0 红葡 萄酒 19 20 21 22 23 24 25 样品 8 0.632 17 0.079 26 0.092 9 0.178 18 0.381 27 0.678 1.00 0.037 0.768 0.257 0.569 0.927 0.788 表2 白葡萄酒各样品的方差分析结果
白葡 萄酒 样品 1 2 3 4 5 6 7 8 9 10 0.990 0.392 0.188 0.817 0.949 0.832 0.299 0.054 0.952 0.979 白葡 萄酒 样品 11 12 13 14 15 16 17 18 19 20 0.510 0.325 0.737 0.270 0.304 0.601 0.200 0.082 0.673 0.432 白葡 萄酒 样品 21 22 23 24 25 26 27 28 0.943 0.459 0.620 0.462 0.136 0.540 0.896 0.881 在显着性水平0.05的情况下,两组评酒员的评分结果无显着差异;在显着性水平00.05的情况下,两组评酒员的评分结果存在显着性差异。经方差分析,发现两组评酒员仅红葡萄酒样品20的评分存在显着性差异,其他酒样品的评分结果均无显着性差异,那么,可以认为两组评酒员的评分结果无显着性差异。
由于两组评酒员的评价结果无显着差异,那么这两组评价结果来自于同一个总体,这两组评价结果总的均值可以认为是总体的期望值,可以通过分别计算两组评价结果的相对于总体期望值的方差来进行判断哪一组的评价结果更为可信。 方差计算公式:
对于第i种酒样品,各评酒员的评价结果的方差Si2满足: 其中xij代表第j个评酒员对第i种酒样品的评分,xi代表第i种酒样品的评分期望值,
n代表共有n个评酒员。
_各组评酒员对所有酒样品的评价结果的方差S2满足: 其中m代表酒样品的总数。
将各组评酒员对各样品就得评分代入方差计算公式,经计算得:
红酒:
第一组评酒员评分的方差和为1843.108,第二组评酒员评分的方差和为1168.786。 白酒:
第一组评酒员评分的方差和为3220.424,第二组评酒员评分的方差和为1659.030。
可以看出不管红酒还是白酒,第二组评酒员评分的方差小于第一组,说明该组的评分数据和第一组相比更加接近于期望值,更稳定,因此本文认为第二组评酒员的评价结果更加可信。
问题二:酿酒葡萄的分级——主成分分析法和相关性分析法
本文先对附件2中的数据进行预处理,多次测量的同一指标数据取其平均值,然后对附件中酿酒葡萄的的理化指标进行分析。
由于酿酒葡萄的理化指标变量较多且各指标之间的存在相关性,势必增加了分析问题的复杂性,因此考虑多个变量综合为少数几个代表性变量,能够代表原始变量的绝大多数信息,并且在新的综合变量基础上,可以进一步的统计分析,本文采用主成分分析法对酿酒葡萄的理化指标进行分析。
1:主成分分析法
对于一个样本资料,观测p个变量x1,x2,Lxp,n个样品的数据资料阵为:
x1jx2j其中:xj,Mxnjj1,2,Lp
主成分分析就是将p个观测变量综合成为p个新的变量(综合变量),即 简写为:
要求模型满足以下条件:
①Fi,Fj互不相关(ij,i,j1,2,L,p) ②F1的方差大于F2的方差大于F3的方差,依次类推 ③ak12ak22Lakp21k1,2,Lp.
于是,称F1为第一主成分,F2为第二主成分,依此类推,有第p个主成分。主成分又叫主分量,这里aij我们称为主成分系数。
上述模型可用矩阵表示为: 其中:
A称为主成分系数矩阵。 假设样本观测数据矩阵为:
首先对原始数据进行标准化处理: 其中: 然后计算样本相关系数矩阵:
为方便,假定原始数据标准化后仍用X表示,则经标准化处理后的数据的相关系数为:
再用雅克比方法求相关系数矩阵R的特征值(1,2Lp)和相应的特征向量
aiai1,ai2,Laip,i1,2Lp。
最后选择重要的主成分,并写出主成分表达式[3]。
主成分分析可以得到p个主成分,但是,由于各个主成分的方差是递减的,包含的信息量也是递减的,所以实际分析时,一般不是选取p个主成分,而是根据各个主成分累计贡献率的大小选取前k个主成分,这里贡献率就是指某个主成分的方差占全部方差的比重,实际也就是某个特征值占全部特征值合计的比重。即贡献率q满足: 贡献率越大,说明该主成分所包含的原始变量的信息越强[4]。主成分个数k的选取,主要根据主成分的累积贡献率来决定,即一般要求累计贡献率达到80%以上,这样才能保证综合变量能包括原始变量的绝大多数信息。
本文利用SPSS软件分别对红葡萄和白葡萄的理化指标进行主成分分析,得到以下的结果:
红葡萄理化指标的10种主要成分有:
DPPH自由基,出汁率,榭皮素,葡萄糖,柠檬酸,褐变度,可滴定酸,百粒质量,丝氨酸,H1
白葡萄理化指标的12种主要成分有:
谷氨酸,葡萄总黄酮,固酸比,缬氨酸,山柰酸,异亮氨酸,苹果酸,甘氨酸,DPPH自由基,出汁率,VC含量,多酚氧化酶活力。
得到葡萄的主要理化指标后,再运用相关性分析法分析葡萄的各主要理化指标与葡萄酒质量的相关性。 2:相关性分析法 (1)相关性分析法
相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。 (2)相关系数
简单相关系数:在线性条件下说明两个变量之间相关关系密切程度的统计分析指标,简称相关系数。
其中cov(x,y) 为x,y的协方差,D(x),D(y)分别为x,y的方差
令:
因此可得到
当的取值介于-1与1之间,的取值范围是 [-1,1]。当0时,x与y为正相关,当0时,x与y为负相关。 的数值愈接近于1,表示x与y直线相关程度愈高;反之, 的数值愈接近于0,表示x与y直线相关程度愈低。
通常判断的标准是: 0.3称为微弱相关,0.30.5称为低度相关,
0.50.8称为显着相关 ,0.81称为高度相关或强相关[5]。
运用SPSS软件分析酿酒葡萄理化指标的主成分数据和葡萄酒质量的相关性,得到以下结果:
表3 红葡萄的理化指标与红葡萄酒质量的相关性 葡萄的主要理化指标 DPPH自由基 出汁率 槲皮素 葡萄糖 柠檬酸 褐变度 可滴定酸 百粒质量 丝氨酸 H1 葡萄的主要理化指标 VC含量 苹果酸 多酚氧化酶活力 DPPH自由基 葡萄总黄酮 固酸比 出汁率 谷氨酸 缬氨酸 异亮氨酸 山奈酚 甘氨酸 上述两表结果显示:
红葡萄酒质量 0.605 0.303 0.288 -0.064 -0.205 -0.013 -0.265 0.156 0.033 -0.054 白葡萄酒质量 0.190 0.214 -0.235 0.294 -0.226 -0.262 -0.130 0.354 0.210 0.307 0.113 0.232 表4 白葡萄的理化指标与红葡萄酒质量的相关性
红葡萄酒的质量与红葡萄理化指标中的槲皮素,葡萄糖,柠檬酸,褐变度,可滴定酸,百粒质量,丝氨酸,H1微弱相关;与出汁率低度相关;与DPPH自由基显着相关。
白葡萄酒的质量与白葡萄理化指标之中的葡萄总黄酮,固酸比,缬氨酸,山柰酸,异亮氨酸,苹果酸,甘氨酸,DPPH自由基,出汁率,VC含量,多酚氧化酶活力微弱相关;与谷氨酸低度相关。
考虑到葡萄的分级问题,本文将上述相关分析中各指标所得相关系数作为权重,求出各指标权重衡量下的求和函数:
其中,ai为红葡萄中各理化指标的相关系数;ai'为白葡萄中各理化指标的相关系数代入红白葡萄样品中相应的理化指标,得到以下值:
表5 红葡萄理化指标加权值 样品 1 0.52 2 1.11 3 1.10 4 -0.74 5 0.27 6 -0.55 7 -1.09 8 0.16 9 2.39 样品 10 0.40 11 -1.07 12 -1.57 13 0.78 14 0.79 15 -1.30 16 -0.72 17 0.22 18 -1.10 样品 19 0.50 20 0.07 21 -0.57 22 -0.66 23 1.99 24 -0.23 25 -0.07 26 0.43 27 -1.06 表6 白葡萄理化指标加权值
样品 1 -1.02 11 -2.06 2 0.134 12 -0.61 3 1.90 13 0.98 4 0.84 5 0.87 6 1.19 7 0.38 8 -2.20 9 -0.02 10 0.193 样品 14 0.36 15 1.08 16 -2.63 17 0.48 27 0.56 18 -0.97 28 1.63 19 -2.02 20 0.97 样品 21 0.24 22 0.20 23 0.35 24 0.88 25 0.008 26 0.26 分析上述两表发现不论红葡萄还是白葡萄,所对应权重求和值分别在-2~3和-3~2之间,由此本文考虑以1为间距分级,分五级,数值越小代表级数越高,葡萄质量越高[6]。
表7 红葡萄各样品的分级情况
红葡萄级别 1(2) 2(1~2) 3(0~1) 4(-1~0) 红葡萄样品 9 2,3,15,23,28 1,5,8,10,13,14,17,19,20,26 4,6,16,21,22,24,25 5(1) 白葡萄级别 1(1) 2(0~1) 3(-1~0) 4(-2~-1) 5(2) 7,11,12,18,27 表8 白葡萄各样品的分级情况
白葡萄样品 3,6,15,28 2,4,5,7,10,13,14,17,20,21~27 9,12,18 1 8,11,16,19 问题三:酿酒葡萄与葡萄酒理化指标之间的联系—相关性分析法
为了能够得到酿酒葡萄和葡萄酒的理化指标之间的联系,本文依据问题二中所得的关于酿酒葡萄的主要理化指标,仍借助相关性分析法,分析了这些指标与所给葡萄酒的理化指标之间的相关度,所得结果如下表所示:
表9 红葡萄与红葡萄酒的理化指标的相关性分析
酒花色苷 DPPH自由基 0.567 酒单宁 酒总酚 酒总黄酮 0.764 0.483 0.231 酒白藜芦醇 0.421 0.256 0.099 0.026 -0.204 -0.095 0.109 -0.045 0.211 -0.007 DPPH半抑制体积 0.778 0.424 0.376 0.090 0.017 0.380 -0.061 -0.229 -0.048 0.116 酒L 酒A 酒B -0.707 -0.441 -0.516 -0.037 -0.254 -0.564 -0.123 -0.008 -0.055 -0.100 0.753 0.814 0.361 0.399 0.514 0.346 出汁率 0.328 槲皮素 0.356 0.047 0.312 -0.190.576 0 -0.269 -0.335 -0.015 -0.244 葡萄糖 -0.024 0.085 0.019 -0.006 柠檬酸 0.380 褐变度 0.767 可滴定酸 百粒质量 0.145 0.139 -0.082 0.445 0.459 0.443 -0.216 -0.066 -0.116 -0.181 -0.263 -0.329 -0.255 -0.248 0.198 0.265 0.074 0.309 0.150 -0.176 -0.125 丝氨酸 -0.233 -0.132 -0.060 -0.125 H1 0.114 0.105 0.075 0.059 0.110 0.078 0.285 -0.053 -0.216 分析上表,得到红葡萄酒的理化指标与酿制红葡萄酒的酿酒葡萄的理化指标之间的相关程度如下:
红葡萄酒中的花色苷与酿酒葡萄中的DPPH自由基、褐变度显着相关,与酿酒葡萄的出汁率、槲皮素、柠檬酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关。 红葡萄酒中的单宁与酿酒葡萄中的DPPH自由基、槲皮素显着相关,与酿酒葡萄中 的出汁率、褐变度、百粒质量低度相关,与其他主要理化指标微弱相关。
红葡萄酒中的总酚与酿酒葡萄中的DPPH自由基高度相关,与酿酒葡萄中的H1显着相关,与酿酒葡萄中出汁率,槲皮素、褐变度低度相关,与其他主要理化指标微弱相关。
红葡萄酒中的酒总黄酮与酿酒葡萄中的DPPH自由基显着相关,与酿酒葡萄中的出汁率、褐变度低度相关,与酿酒葡萄中的其他主要理化指标微弱相关。
红葡萄酒中的白藜芦醇与酿酒葡萄中的DPPH自由基低度相关,与酿酒葡萄中的其他主要理化指标微弱相关。
红葡萄酒中的DPPH半抑制体积与酿酒葡萄中的DPPH自由基显着相关,与酿酒葡萄中的出汁率、榭皮素、褐变度低度相关,与酿酒葡萄中的其他主要理化指标微弱相关。
红葡萄酒中的色泽L*与酿酒葡萄中的DPPH自由基显着相关,与酿酒葡萄中的出汁率、褐变度、百粒质量低度相关,与其他主要理化指标微弱相关。
红葡萄酒中的a*与酿酒葡萄中褐变度低度相关,与酿酒葡萄中的其他主要理化指标微弱相关。
红葡萄酒中的b*与酿酒葡萄中的榭皮素、葡萄糖低度相关,与酿酒葡萄中的其他主要理化指标微弱相关。
表10 白葡萄与白葡萄酒的的理化特性之间的相关性分析 酒单酒总酒白藜芦DPPH半抑制酒总酚 宁 黄酮 醇 体积 VC含量 苹果酸 多酚氧化酶活力 DPPH自由基 葡萄总黄酮 固酸比 出汁率 谷氨酸 缬氨酸 -0.16-0.100 -0.155 5 0.046 0.122 0.467 -0.23-0.403 -0.232 7 0.409 0.450 0.495 0.588 0.039 0.082 0.133 0.697 0.138 0.130 -0.249 0.156 0.082 -0.101 -0.159 0.091 -0.171 0.221 -0.283 0.233 -0.123 -0.369 0.387 0.430 -0.089 -0.152 0.262 0.070 0.435 酒L 0.220 0.099 0.006 -0.053 0.102 -0.371 0.688 -0.625 -0.103 -0.098 酒A 酒B -0.093 -0.101 0.378 -0.271 -0.024 -0.046 0.056 0.028 0.434 -0.206 -0.176 0.355 0.415 -0.757 -0.067 0.498 0.142 0.020 -0.212 0.192 -0.29-0.293 -0.048 5 0.384 0.391 0.119 0.217 0.073 0.136 -0.075 异亮氨酸 0.300 0.185 山奈酚 甘氨酸 0.143 0.086 0.194 0.254 0.005 0.171 0.006 -0.134 0.116 -0.006 -0.189 -0.361 -0.021 0.159 0.001 0.253 分析上表,得到白葡萄酒的理化指标与酿制白葡萄酒的酿酒葡萄的理化指标之间的相关程度如下:
白葡萄酒中的单宁与酿酒葡萄的DPPH自由基、葡萄总黄酮、谷氨酸、异亮氨酸低度相关,与酿酒葡萄的其他主要理化指标微弱相关。
白葡萄酒中的总酚与酿酒葡萄中的葡萄总黄酮显着相关,与酿酒葡萄中的多酚氧化酶活力、DPPH自由基、谷氨酸低度相关,与酿酒葡萄中的其他主要理化指标微弱相关。
白葡萄酒中的酒总黄酮与酿酒葡萄中的葡萄总黄酮显着相关,与酿酒葡萄中的苹果酸低度相关,与其他主要理化指标微弱相关。
白葡萄酒中的白藜芦醇与酿酒葡萄的主要理化指标微弱相关。
白葡萄酒中的DPPH半抑制体积与酿酒葡萄中的多酚氧化酶活力、DPPH自由基、葡萄总黄酮、异亮氨酸低速相关,与其他主要理化指标微弱相关。
白葡萄酒中的L与酿酒葡萄中的出汁率、谷氨酸显着相关,与酿酒葡萄中的固酸比、甘氨酸低度相关,与其他主要理化指标微弱相关。
白葡萄酒中的a*与酿酒葡萄中的苹果酸、葡萄总黄酮、出汁率低度相关,与酿酒葡萄中的其他主要理化指标微弱相关。
白葡萄酒中的b*与酿酒葡萄中的出汁率显着相关,与酿酒葡萄中的固酸比、谷氨酸低度相关,与酿酒葡萄中的其他主要理化指标微弱相关。
问题四:酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响
查阅相关资料,葡萄的质量受到很多因素的影响,如酿酒葡萄的理化指标,芳香物质的多少以及酿酒方法环境等[7]。
为了分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,本文根据问题二和问题三的分析,参考葡萄的理化指标中的主成分,葡萄酒的理化指标,葡萄的芳香物质以及葡萄酒中的芳香物质,欲对葡萄酒的质量进行相关性分析。
葡萄和葡萄酒的芳香物质成分过多,本文再次运用主成分分析法对其进行降维分析。 用SPSS软件分析得到芳香物质的主成分如下: 红葡萄:
2-辛酮、1-庚醇、1-壬醇、(E)-3,7-二甲基-2,6-辛二烯-1-醇、乙醛,苯乙醛; 白葡萄:
乙酸己酯、(Z)-乙-庚烯醛、1-壬醇、壬酸乙酯、(Z)-3,7-二甲基-2,6-辛二烯醛、辛酸乙酯、反式-2-壬烯酸、1-庚醇、1-辛醇; 红葡萄酒:
异山梨糖醇、2,5-二(1,1-二甲基乙基)-1,4,-苯二醇、5-甲基糖醛、2-甲基-1-丙醇、乙酸异戊酯、3-甲硫基-1-丙醇、3,7-二甲基-1,5,7-辛三烯-3-醇、香叶基乙醚;
白葡萄酒:
辛酸乙酯、(R)-3,7-二甲基、乳酸乙酯、2-壬醇、丙酸乙酯、苯乙烯、2-己丙烯酸乙酯、乙酸-2-甲基丙基酯、乙酸正丙基、3,7-二甲基-1,6-辛二烯-3-醇。
下面运用相关性分析法对酿酒葡萄和葡萄酒的主要理化指标,葡萄和葡萄酒的芳香物质的主要成分与葡萄酒质量之间的相关性进行分析:
葡萄酒质量与酿酒葡萄的理化指标的相关性分析结果在问题二中已经给出。
为简单起见,对于附件3中的芳香物质用编号来代替,如葡萄酒的芳香物质按附件所给的顺序用酒芳香1~酒芳香73进行编号,葡萄的芳香物质按附件所给顺序用葡萄芳香1~葡萄芳香55进行编号。
下面两表为其余因素的相关性分析结果:
表11 各因素对红葡萄酒质量相关性
酒花色苷 红葡萄酒 0.153 酒B 红葡萄酒 0.245 红酒芳香11 红葡萄酒 0.031 酒总黄酒单宁 酒总酚 酮 0.486 红酒芳香72 -0.237 葡萄芳香54 0.522 0.493 红酒芳香71 0.106 葡萄芳香44 0.168 0.518 红酒芳香49 0.326 葡萄芳香45 0.22 酒白藜DPPH半芦醇 抑制体积 0.511 0.55 酒L -0.454 红酒芳香33 0.219 葡萄芳香13 -0.114 酒A 0.186 红酒芳香28 0.01 红酒芳红酒芳香香41 39 0.374 0.011 葡萄芳葡萄芳香香35 25 0.088 -0.075 表12 各因素对白葡萄酒的相关性
酒单宁 酒总酚 白葡 萄酒 0.106 白酒芳香4 白葡萄酒 -0.103 白酒芳香37 白葡萄酒 0.283 葡萄芳香43 0.065 白酒芳香5 0.183 白酒芳香50 0.122 葡萄芳香45 酒总黄酮 -0.194 白酒芳香6 0.105 葡萄芳香24 -0.164 葡萄芳香46 酒白藜芦醇 -0.164 白酒芳香16 -0.142 葡萄芳香27 0.073 抑制体积 0.191 白酒芳香22 0.287 葡萄芳香33 0.091 酒L -0.17 白酒芳香23 0.155 葡萄芳香35 0.078 酒A -0.135 白酒芳香27 0.397 葡萄芳香39 0.082 酒B 0.175 白酒芳香35 0.11 葡萄芳香40 -0.213 白葡萄酒 0.08 0.083 0.076 分析上表,为了更合理更清晰的解释酿酒葡萄和葡萄酒的理化指标以及葡萄或葡萄酒中的芳香物质与葡萄酒质量的关联程度,去除与葡萄酒质量相关程度极其微弱(即||0.1)的因素:例如红葡萄酒质量的相关的因素去除酿酒葡萄中的葡萄糖、褐变度、丝氨酸、H1、红酒芳香39、红酒芳香28、红酒芳香11、葡萄芳香35、葡萄芳香25。
取剩下的因素作为自变量,葡萄酒质量为因变量,运用多元线性回归模型建立相应函数关系。
设y是一个可观测的随机变量,它受到p个非随机因索x1,x2,L,xp和随机因素的影响,y若与x1,x2,L,xp有如下线性关系:
其中0,1,L,p是p1个未知参数,是不可测的随机误差,且通常假定
~N(0,2).上式为多元线性回归模型[8]。
本文建立以葡萄和葡萄酒的理化特性、葡萄和葡萄酒的芳香物质为自变量,葡萄质量为因变量的函数:
红葡萄 yaixie
i124 白葡萄 ybixi'e'
'i131其中,ai为与红葡萄酒质量相关的各因素的系数;bi为与白葡萄酒质量相关的各因素的系数;e,e'为常数。
借助MATLAB软件解得常数e为184.863,各理化特性的系数为:、
表13 红葡萄酒函数的系数
1 2 3 4 5 1.5517 13 0.4850 21 6 7 8 -0.2241 -4.9345 -5.8775 -0.1024 9 10 11 12 -24.288 -0.3451 -0.0114 14 0.2511 22 15 0.0464 23 16 -0.0040 24 -7.5170 -2.8251 -0.0090 -1.7842 17 1.2221 1 0.2117 8 15.3819 15 18 19 20 -3.3944 -1.5569 2 0.4532 9 0.4805 16 3 1.2024 25.7641 -0.4954 -0.3168 -0.2547 4 -15.2307 11 -29.5147 18 5 11.3249 12 3.8758 19 6 -7.5792 13 -16.6711 20 7 17.6653 14 0 21 表14 白葡萄酒函数的系数
-4.9338 10 19.5342 17 4.0004 22 2.0872 29 2.4372 0 23 0 30 -0.2852 -8.3227 24 13.2277 31 0.0313 0.6136 25 -0.1117 -0.7674 26 -6.1658 18.7673 27 -0.1917 1.7427 28 1.7394 0 综合考虑相关性分析结果与多元线性回归模型的结果,可以看出葡萄酒的质量与酿酒葡萄和葡萄酒的理化指标,酿酒葡萄和葡萄的芳香物质紧密相关,不能单纯的通过酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,还应综合考虑芳香物质等其他因素对其的影响。
事实上,本文查阅相关资料后发现,葡萄酒的质量受也很多外在因素的影响。葡萄酒是人和自然关系的产物,是人在一定的气候、土壤等生态条件下,采用相应的栽培技术,种植一定的葡萄品种,收获其果实,通过相应的工艺进行酿造的结果[9]。因此,原产地的生态条件、葡萄品种以及人所采用的栽培、采收、酿造方式等,决定了葡萄酒的质量和风格。因此,影响葡萄酒质量和风格的因素可分为自然因素和人为因素两大类。自然因素包括气候、地质、土壤等生态条件和与之相适应的品种;人为因素包括与自然因素相适应的栽培管理措施和酿造、贮藏方式等。酿酒时贮藏的温度,湿度,紫外线,震荡,通风情况,摆置角度以及贮藏年份都会造成葡萄酒口感变化。要对葡萄酒质量有一个更加客观与信服的评价,必须综合考虑各方面因素,而不能仅从酿酒葡萄与葡萄酒的理化指标方面得出结论。同时也说明了高品质的葡萄酒的酿造过程是十分精细的,从葡萄的选取到酿造都需要经验与技术的结合。
五:模型评价
模型优点:
本文应用降维的思想用主成分分析法对酿酒葡萄、葡萄酒的理化指标以及芳香物质中的各种成分进行筛选,将多个变量综合为少数几个代表性变量,能够代表原始变量的绝大多数信息。
相关分析法分析了理化指标、芳香物质和葡萄酒的质量之间的定量关系,使得我们可以忽略理化指标中一些对酿酒葡萄分级和葡萄酒质量影响不明显的不相关和微弱相关的因素。
利用多元线性回归模型,综合考虑了与葡萄酒质量紧密相关的各因素,从而更为准确的对葡萄酒的质量进行定量判断。 模型缺点:
由于本文对葡萄和葡萄酒的一级二级理化指标和芳香物质中的各种成分都进行了分析和筛选,使得计算量较大并且比较繁琐。
六:参考文献
[1] 徐洪文,关于“显着性检验”问题的讨论,宁夏大学学报,第28卷:146-147,2007。
[2] 王国胜,农业科研中显着性检验与显着性水平的讨论,安徽农业科学,第35卷第19期:5676-5677,2007。
[3] 黄长友,中药微量元素的主成分分析,广东微量元素科学,第14卷第4期:40-41,2007。
[4] 叶晓枫 王志良,主成分分析法在水资源评价中的应用,河南大学学报,第37卷第3期:277-279,2007。
[5] 郑德如,回归分析和相关分析,上海:上海人民出版社,52-69,1984。
[6] 张丽芝,贺兰山东麓红葡萄酒等级划分客观标准的初步研究,中国食物与营养,第18卷第3期:30-31,2012。
[7] 林翠香,基于数据挖掘的葡萄酒质量识别,中南大学硕士生论文,2010。 [8] 李继成,数学实验,北京:高等教育出版社,188-194,2009。
[9] 王喜娥,正确储存葡萄酒提高葡萄酒质量,农业科学,第9期:55-57,2011。
七、附录
附录1:
使用spss软件进行方差分析、主成分分析、相关性分析; 使用matlab软件进行多元线性回归分析。 附录2:
问题一的方差分析的源程序见“J0113源程序”文件夹中的“问题一”子文件夹中的“白葡萄酒方差分析数据.sav”和“红酒评分方差分析数据.sav”。 附录3:
问题一的方差分析的原始结果见“J0113源程序”文件夹中的“问题一”子文件夹中的“白葡萄酒方差分析结果.spv”和“红酒评分方差分析结果.spv”。 附录4:
问题二的酿酒葡萄的理化指标的主成分分析的源程序见“J0113源程序”文件夹中的“问题二”字文件夹中的“白酿酒葡萄主成分分析数据.sav”和“红酿酒葡萄主成分分析数据.sav”。 附录5:
问题二的酿酒葡萄的理化指标的主成分分析的原始结果见“J0113源程序”文件夹中的“问题二”字文件夹中的“白酿酒葡萄主成分分析结果.spv”和“红酿酒葡萄主成分分析结果.spv”。 附录6:
问题二的葡萄酒质量与酿酒葡萄的主要理化指标的相关性分析源程序见“J0113源程序”文件夹中的“问题二”字文件夹中的“白酒相关分析数据.sav”和“红酒相关分析数据.sav”。 附录7:
问题二的葡萄酒质量与酿酒葡萄的主要理化指标的相关性分析原始结果见“J0113源程序”文件夹中的“问题二”字文件夹中的“白酒相关分析结果.spv”和“红酒相关分析结果.spv”。 附录8:
问题三的葡萄酒的理化指标与酿酒葡萄的理化指标的相关性分析源程序见“J0113源程序”文件夹中的“问题三”子文件夹中的“白酒相关分析数据.sav”和“红酒相关分析数据.sav”。 附录9:
问题三的葡萄酒的理化指标与酿酒葡萄的理化指标的相关性分析原始结果见“J0113源程序”文件夹中的“问题三”子文件夹中的“白酒相关分析结果.spv”和“红酒相关分析结果.spv”。
附录10:
问题四的葡萄和葡萄酒中芳香物质的主成分分析的源程序见“J0113源程序”文件夹中的“问题四”子文件夹中的“白酒芳香物质主成分分析数据.sav”、“红酒芳香物质主成分分析数据.sav”、“白葡萄芳香物质主成分数据.sav”和“红葡萄芳香物质主成分数据.sav”。 附录11:
问题四的葡萄和葡萄酒中芳香物质的主成分分析的原始结果见“J0113源程序”文件夹中的“问题四”子文件夹中的“白酒芳香物质主成分分析结果.spv”、“红酒芳香物质主成分分析结果.spv”、“白葡萄芳香物质主成分结果.spv”和“红葡萄芳香物质主成分结果.spv”。
附录12:
问题四的葡萄和葡萄酒的理化指标、葡萄和葡萄酒中芳香物质与葡萄酒质量的相关性分析源程序见“J0113源程序”文件夹中的“问题四”子文件夹中的“白酒相关分析数据.sav”和“红酒相关分析数据.sav”。 附录13:
问题四的葡萄和葡萄酒的理化指标、葡萄和葡萄酒中芳香物质与葡萄酒质量的相关性分析原始结果见“J0113源程序”文件夹中的“问题四”子文件夹中的“白酒相关分析结果.spv”和“红酒相关分析结果.spv”。 附录14:
问题四的多元线性回归分析的源程序见“J0113源程序”文件夹中的“问题四”子文件夹中的“HongPuTao.m”和“BaiPuTao.m”。
因篇幅问题不能全部显示,请点此查看更多更全内容