2011年 12月 Transactions of the CSAE Dec. 2011 297
基于主成分分析和判别分析的白酒品牌鉴别方法
霍丹群1,张苗苗1,侯长军1,秦 辉1,尹猛猛1,
沈才洪2,3,张宿义1,2,卢中明1,2 ,张 良2,3
(1.重庆大学生物工程学院,生物流变科学与技术教育部重点实验室,重庆 400044; 2.国家固态酿造工程技术研究中心,泸州 646000; 3.泸州老窖股份有限公司,泸州 646000)
摘 要:白酒的香气物质决定了白酒产品的差异。为了实现不同白酒产品的区分鉴别,提出了基于气相色谱分析技术结合模式识别实现白酒区分的方法。采集了7种产品共70个白酒样本的气相色谱数据,定性定量分析了己酸乙酯、乳酸乙酯等10种基本香气物质的含量,并对测定的物质进行主成分分析,验证区分效果,最后利用线性判别法建立判别函数,对不同白酒进行区分。结果表明,2种分析方法均可用于区分不同白酒,主成分分析结果显示,前3个主成分累计贡献率为86.527%,能有效描述香气物质和产品之间的复杂关系;线性判别分析对所有样本均得到准确的判别,正确率为100%,对预测样本的正确判别率达93.9%,建立的判别函数能准确区分不同白酒。研究表明,利用气相色谱技术结合模式识别的方法可用于不同白酒的区分鉴别。
关键词:气相色谱,风味,主成分分析,线性判别分析,白酒 doi:10.3969/j.issn.1002-6819.2011.z2.057
中图分类号:TS262.3, O657.7+1 文献标识码:A 文章编号:1002-6819(2011)-Supp.2-0297-05
霍丹群,张苗苗,侯长军,等. 基于主成分分析和判别分析的白酒品牌鉴别方法[J]. 农业工程学报,2011,27(增刊2):297-301.
Huo Danqun, Zhang Miaomiao, Hou Changjun, et al. Recognition method of liquor brands based on principal component and linear discriminant analysis[J]. Transactions of the CSAE, 2011, 27(Supp.2): 297-301. (in Chinese with English abstract)
0 引 言
白酒是以曲类、酒母、糖化酶等为糖化发酵剂,利用高粱、玉米、大麦、糯米等谷物为原料,经蒸煮、糖化、发酵、蒸馏、贮存、勾调而成的蒸馏酒。白酒是一个复杂的体系,除了含有98%的乙醇和水外,还含有2%的微量成分,其醇类、醛类、酯类、酸类、酚类等是决定白酒香气、口感和风格的关键。由于地域、原料、酿造工艺及贮存方式等差异,中国白酒种类繁多,香气风格迥异。以往对白酒产品的区分,主要依靠品酒师的感官进行判别,但是这种鉴别方法不仅需要长期的经验积累,而且受人的感官和精神状态影响较大,稳定性和准确性难以保证。近年来,随着气相色谱分析技术广泛应用于白酒香气物质的定性定量分析[1-3],使得白酒质量、香型、品牌的鉴别结果更加准确。随着气相色谱分析技术的不断发展,白酒中检出的风味物质日益增多,通过多种检出物质对白酒进行区分可行性不大,只有对决定酒类风味成因的微量成分进行定量分析才具有积极意义。目前,模式识别在食品分析中的优越性日益显露,已有
许多研究人员将这一方法用于茶叶、酒类、食品工艺[4-10]等领域的研究,并取得了一定成果。本文以气相色谱测定的酯类、醇类等10种基础香气物质为变量,结合主成分分析法和线性判别分析法对7种白酒共70个样本进行区分鉴别,以期为更多白酒产品的区分鉴别提供新的方法,为白酒区分标准的建立提供理论依据和参考价值。
1 材料与方法
1.1 仪器设备
Agilent 6890N 气相色谱仪:带7683B 自动进样器、配FID检测器和Agilent 色谱工作站(美国安捷伦科技有限公司);乙酸正戊酯(内标)、叔戊醇(内标)、2-乙基正丁酸(内标)和无水乙醇均为光谱纯,纯度>99.5%,美国Sigma-Alorich公司。 1.2 材料
表1为试验用7种白酒,所有酒样均为市购。
表1 试验用7种白酒
Table 1 7 brands of liquors in experiments
品 牌 国窖1573(LG) 泸州老窖百年(LB)泸州老窖特曲(LT)丰谷老窖(FGLJ) 丰谷特曲(FGTU) 丰谷酒王(FGJW)
西凤酒(XF)
香型
酒度
数量/瓶
产地
浓香型 52°±0.3° 6 四川·泸州 浓香型 52°±0.3° 7 四川·泸州 浓香型 38°±0.3° 6 四川·泸州 浓香型 48°±0.3° 12 四川·绵阳 浓香型 48°±0.3° 12 四川·绵阳 浓香型 48°±0.3° 12 四川·绵阳 凤香型 50°±0.3° 15 陕西·宝鸡
收稿日期:2011-03-09 修订日期:2011-10-27
基金项目:国家自然科学基金(30770568);中央高校基本科研业务费资助(CDJXS11231179,CDJXS102300);四川省科技支撑计划(2010NZ0093); 重庆市科委攻关项目(2008AC7037)
作者简介:霍丹群(1965-),女,教授,副院长,博士生导师;研究方向:生物大分子、生物芯片、纳米材料与检测技术。重庆 重庆大学生物工程学院,400044。Email: huodq@cqu.edu.cn
298 农业工程学报 2011年
1.3 方法
1.3.1 供试样品的制备
用色谱纯乙醇和超纯水配制体积分数60%的乙醇溶液,以此为基体,配制体积分数2%的叔戊醇、2%的乙酸正戊酯与2%的2-乙基正丁酸的3种内标混合液,然后准确移取10 mL酒样,添加0.1 mL内标混合溶液后混匀即可供进样。
1.3.2 气相色谱工作条件
毛细管柱为HP-INNOWAX,长30 m,内径0.25 mm,涂层厚0.25 μm;载气为氮气,分流比为40∶1,流速 1.4 mL/min;进样口温度230℃;起始温度40℃,保留 5 min,5℃/min升温至92℃,保留2 min,30℃/min升温至230℃,保留10 min。进样口温度为230℃,检测器温度为250℃。检出物的定性主要依靠气相色谱分析,定量采用内标法。 1.4 数据处理
气相色谱所得数据分析采用SPSS17.0软件中的主成分分析法(principal components analysis)和判别分析法[11](linear discriminant analysis)在计算机上进行。
2 结果与分析
2.1 不同品牌白酒10种常规物质测定结果
根据目前国内白酒香气物质的相关研究报道[12-14],对白酒的区分主要是依据醇类、酯类、醛类等几种微量香气物质来完成的,它们含量的差异直接影响了白酒的风格和口感。因此,本文以测定组分的种类和含量为自变量,利用SPSS17.0软件进行多次主成分分析,逐个分析每个组分对白酒风味和口感的贡献,并剔除贡献不显著的自变量,最终选定乙醛、异丁醇、甲醇、正丙醇、异戊醇等10种香气物质作为进一步进行主成分分析和判别分析的研究对象。其中醇类5种,酯类4种,醛类2种,乙缩醛和乙酸乙酯的含量以两者的加和表示,它们在白酒中的含量差异体现了不同系列白酒的特性。试验测定了7种不同产品共70个白酒样本的微量组分,其中筛选出的10种香气组分含量见表2。由表2可知,西凤酒中不含甲醇;来自同一生产厂家的国窖1573、泸州老窖百年、泸州老窖特曲中异戊醇含量为零,而不同白酒中香气成分的差异主要是由白酒酿造原粮、酿造工艺及贮存环境等不同造成的。
表2 不同白酒中主要香气组分的质量浓度
Table 2 Concentrations of principal aroma components in different liquors
组分质量浓度/(g·L-1)
品牌
乙醛
甲醇
正丙醇
异丁醇
正丁醇 0.009±0.0350.004±0.0640.006±0.0640.012±0.1120.037±0.0900.006±0.0620.010±0.021
异戊醇 0.014±0.1270.010±0.2380.023±0.259
0 0 0 0.061±0.092
丁酸乙酯 0.029±0.1490.025±0.1540.019±0.1760.037±0.3820.125±0.2560.016±0.1600.150±0.187
乳酸乙酯
己酸乙酯
乙缩醛+ 乙酸乙酯 0.089±0.9340.124±1.5090.115±1.5370.154±1.3320.436±1.0960.080±0.6410.769±0.768
FGLJ 0.021±0.232 0.035±0.081 0.012±0.086 0.012±0.087FGTQ 0.034±0.428 0.038±0.119 0.005±0.153 0.010±0.144FGJW
0.039±0.422 0.054±0.125 0.054±0.261 0.015±0.141
LG 0.048±0.223 0.009±0.076 0.019±0.161 0.009±0.082LB 0.076±0.188 0.025±0.062 0.053±0.145 0.027±0.063LT 0.037±0.197 0.008±0.045 0.015±0.091 0.004±0.051XF 0.042±0.056 0 0.039±0.078 0.008±0.015
0.095±0.748 0.001±0.0080.110±1.076 0.141±2.3150.094±0.948 0.188±2.1520.054±0.822 0.001±0.0080.273±0.820 0.003±1.5160.084±0.493 0.232±0.9360.979±1.129 1.530±1.644
2.2 主成分分析结果
主成分分析虽然可以保证各主成分之间的正交性,但如果不进行旋转变换将很难对主成分命名,因此本研究对初始因子负荷矩阵进行最大正交旋转变换,使每个变量中需要解释的因子数量最少。本研究以70个样本的10种香气物质含量构成70×10的矩阵,利用SPSS17.0软
表3 相关矩阵的特征值
Table 3 Eigen-values of the correlation matrix
成分 PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10
特征值 5.054 2.246 1.353 0.474 0.320 0.254 0.138 0.092 0.038 0.031
方差贡献率/%
50.540 22.462 13.526 4.735 3.199 2.538 1.379 0.925 0.384 0.312
累积方差贡献率/%
50.540 73.002 86.527 91.262 94.462 97.000 98.379 99.303 99.688 100.000
件进行主成分分析,相关矩阵的特征值如表3所示。由表3可知前3个主成分所构成的信息量占总信息量的86.527%,基本保留了原来变量的信息,故取前3个成分作为该研究问题的主成分进行品牌白酒的区分是可行的、可靠的。
将70个样本的10个原始变量(原始变量为乙醛、甲醇、正丙醇……乙缩醛+乙酸乙酯;分别记作:X1、X2、X3……X10)通过SPSS17.0软件进行分析变换成主成分,主成分是原始变量的线性组合,表4为原始变量与各主成分之间的相关程度。通过主成分分析得到3个无相关性的综合指标模型为:
PC1=0.956X1+0.941X2+0.879X3+0.848X4+0.771X5+ 0.696X6-0.063X7+0.306X8-0.124X9+0.472X10,单独说明整个原始数据标准变异的50.540%,代表变量为乙醛,异丁醇等;
PC2=0.108X1+0.011X2-0.057X3+0.347X4+0.273X5+ 0.498X6+0.936X7+0.803X8-0.026X9-0.181X10,单独说明整个原始数据标准变异的22.462%,代表变量为乳酸乙酯,己酸乙酯;
增刊2 霍丹群等:基于主成分分析和判别分析的白酒品牌鉴别方法 299
PC3=-0.052X1-0.054X2+0.033X3+0.273X4+0.270X5- 0.448X6-0.018X7-0.138X8+0.961X9+0.799X10,单独说明整个原始数据标准变异的13.526%;代表变量为丁酸乙酯,正丁醇等。
表4 原始变量与各主成分间的相关程度
2.3 判别分析结果
鉴于主成分分析对部分白酒区分的局限性,本文对选取的原始变量进行逐步判别分析。经逐步判别分析,取得了6个典则判别函数,其特征值分别为99.389,36.757,19.288,4.630,1.908和0.216,分别能够解释模
Table 4 Degree of correlation between original variables and 型方差变化的61.3%,22.7%,11.9%,2.9%,1.2%,0.1%。
principal components
其中前2个典则判别函数共可解释83.9%的方差变化,包
主成分 含了主要信息,可以描述各香气物质特征的差异与联系。变 量
PC1 PC2 PC3 用前2个典则判别函数对各样品作散点图,结果见图2。
乙醛(X1) 0.956 0.108 -0.052 由图2可见,取得的判别模型可以将7种不同白酒的样异丁醇(X2) 0.941 0.011 -0.054 本区分开,表明选择的10种香气物质可以反映各系列白
-0.057 0.033 甲醇(X3) 0.879 酒的风味特征。
0.347
0.273
0.273 0.270 正丙醇(X5) 0.771
异戊醇(X6) 0.696 0.498 -0.448 0.936 -0.018 乳酸乙酯(X7) -0.063
己酸乙酯(X8) 0.306 0.803 -0.138 -0.026 0.961 丁酸乙酯(X9) -0.124
正丁醇(X10) 0.472 -0.181 0.799
乙缩醛+乙酸乙酯(X4) 0.848
以主成分PC1、PC2、PC3作为x、y、z坐标,可建
立每个样本的三维得分图,如图1所示。从三维得分图可直观得到7种白酒的区分结果,其中西凤酒在空间的分布比较集中,与其他6种白酒相比分类明显,具有较好的聚类特性。国窖1573、泸州老窖百年、泸州老窖特曲3种系列的白酒在三维得分图中可以各自区分,但是因酿造原粮、酿造窖池、酿造工艺等的不同,造成了不同系列白酒中微量物质含量各异的情况,使得这3种白酒在主成分散点图上的分布相对离散。丰谷老窖可与丰谷酒王、丰谷特曲各自区分,但丰谷酒王和丰谷特曲部分分布存在交叉,区分效果相比泸州老窖系列较差,这与表2中选择的微量物质的含量相关,物质含量越接近,其在主成分图上的重叠率越高,分布交叉散乱。由此可见,基于主成分分析的白酒区分方法体现了白酒香气物质种类和含量的个性和共性,反映了白酒风味的典型性及相似性。
图2 典则判别函数散点图
Fig.2 Scatter plot of canonical discriminant functions
典则判别函数直观描述了不同系列白酒化合物之间的关系,但不便于对未知白酒的客观判别。为此,判别函数的区分能力通过Leave-one-out进行交叉检验。在交叉检验时,未分类样品被移除初始变量集。新的分类模型被建立,未分类样品通过此模型进行区分。分类模型由所有样品所得,模型能区分不同系列白酒,正确率达100%。在本研究中,对7种系列70个样本进行判别分析。分别从各个系列中随机抽出2~6个样本不等,共21个测试样,以剩下的49个样本为“训练样本”建立判别函数,然后对开始取出的样本进行判别,确定其类别,并与样本实际类别比对,判别正确率达93.9%,结果表明,选择的变量可用于不同白酒的区分。
3 结 论
不同白酒香气物质的形成过程极为复杂,它们在白酒中的含量和种类随着生产、贮存过程都不断发生变化,一些化合物呈现规律性变化。本文以气相色谱检测技术为手段,分别检测了7种白酒共70个白酒样本的香气物质成分,选取10种贡献显著的香气物质采用主成分分析和逐步判别分析对其进行定性分析研究。主成分分析结果显示前3个主成分的累计方差贡献率可达86.527%,其三维主成分散点图对不同白酒的区分效果良好,具有一
图1 白酒样本主成分(PC1×PC2×PC3)分布图 Fig.1 PCA score plot (PC1×PC2×PC3) for liquors sample
300 农业工程学报 2011年
定的可行性,随着主成分数的提高,其携带的样品信息更多有利于分类。判别分析结果表明对不同白酒及预测样本的正确区分率分别为100%和93.9%,前2个典则判别函数的二维散点图显示区分效果显著,极大的提高了分类正确率。研究结果表明:
1)利用气相色谱分析技术结合模式识别可直观、快速的对白酒进行分类,为白酒的鉴别提供一种快速、准确的新方法。
2)成功鉴别不同系列白酒需要合适的数据处理和分类方法,通过将主成分分析和判别分析作对比,证明了两种方法的可行性,但是判别分析结果优于主成分分析。
3)鉴于不同白酒的香气物质种类及含量差异较大和本试验的样本数量有限,所以研究中得到的模型和函数对于区分其他系列的白酒不一定适用,但这种基于主成分分析和线性判别分析的方法可为更多白酒的区分提供理论依据和参考价值。
[参 考 文 献]
[1] 吕丽,气相色谱法分析白酒中主要香味组分[J]. 酿酒,
2008,35(2):88-89.
Lü Li. The analysis of the trace flavoring components in liquor by gas chromatography[J]. Liquor Making, 2008, 35(2): 88-89. (in Chinese with English abstract)
[2] 胡坷平,程劲松,杨屹,等. 快速毛细管气相色谱分析白酒中的香味成分[J]. 分析科学学报,2008,24(3):323-326.
Hu Keping, et al. Analysis of flavor components in chinese liquor by fast capillary gas chromatography[J]. Journal of Analytical Science, 2008, 24(3): 323-326. (in Chinese with English abstract)
[3] 季克良,郭坤亮,朱书奎,等. 全二维气相色谱/飞行时间
质谱用于白酒微量成分的分析[J]. 酿酒科技,2007,3:
[6] 闫忠心,鲁周民,刘坤,等. 干制条件对红枣香气品质的影响[J]. 农业工程学报,2011,27(1):389-392.
Yan Zhongxin, Lu Zhoumin, Liu Kun, et al. Effects of drying conditions on Chinese jujube aroma components[J]. Transactions of the CSAE, 2011, 27(1): 389-392. (in Chinese with English abstract)
[7] 贾洪锋,卢一,何江红,等. 电子鼻在牦牛肉和生猪肉识别中的应用[J]. 农业工程学报,2011,27(5):358-363. Jia Hongfeng, Lu Yi, He Jianghong, et al. Recognition of yak meat ,beef and pork by electronic nose[J]. Transactions of the CSAE, 2011, 27(5): 358-363. (in Chinese with English abstract)
[8] Wies Cynkar, Robert Dambergs, Paul Smith, et al.
Classification of Tempranillo wines according to geographic origin: Combination of mass spectrometry based electronic nose and chemometrics[J]. Analytica Chimica Acta, 2010, 660(1/2): 227-231. [9] 岳田利,彭帮柱,袁亚宏,等. 基于主成分分析法的苹果
酒香气质量评价模型的构建[J]. 农业工程学报,2007,23(6):223-227.
Yue Tianli, Peng Bangzhu, Yuan Yahong, et al. Modeling of aroma quality evaluation of cider based on principal component analysis[J]. Transactions of the CSAE, 2007, 23(6): 223- 227. (in Chinese with English abstract) [10] 赵改名,柳艳霞,田玮,等. 基于判别分析法的金华火腿
挥发性风味物质的形成过程分析[J]. 农业工程学报,2008,24(3):260-264.
Zhao Gaiming, Liu Yanxia, Tian Wei, et al. Process for forming volatile flavor compounds in Jinhua Ham by discriminant analysis method[J]. Transactions of the CSAE, 2008, 24(3): 260-264. (in Chinese with English abstract) [11] 卢纹岱. SPSS for Windows 统计分析[M]. 第3版. 北京:
电子工业出版社,2003.
[12] 周围,周小平,赵国宏,等. 名优白酒质量指纹专家鉴别
系统[J]. 分析化学,2004,32(6):735-740. 100-102.
Zhou Wei, Zhou Xiaoping, Zhao Guohong, et al. Quality Ji Keliang, Guo Kunliang, Zhu Shukui, et al. Analysis of
fingerprint expert discriminating system of chinese famous microconstituents in liquor by full two-dimensional gas
white spirits[J]. Chinese Journal of Analytical Chemistry, chromatography/time of flight mass spectrum[J].
2004, 32(6): 735-740. (in Chinese with English abstract) Liquor-making Science and Technology, 2007, 3: 100-102.
[13] 汤道文,谢玉球,朱法余,等. 白酒中的微量成分及与白(in Chinese with English abstract)
[4] 宁井铭,张正竹,谷勋刚,等. 基于高效液相色谱的普洱酒风味技术发展的关系[J]. 酿酒科技,2010,5:78-81.
晒青毛茶指纹图谱识别方法[J]. 农业工程学报,2010,Tang Daowen, Xie Yuqiu, Zhu Fayu, et al. Relation between
microconstituents in liquor and the development of liquor 26(3):243-248.
flavor techniques[J]. Liquor-making Science and Technology, Ning Jingming, Zhang Zhengzhu, Gu Xungang, et al.
2010, 5: 78-81. (in Chinese with English abstract) Fingerprint identification method of Pu’er raw tea based on high performance liquid chromatography profiles[J].
Transactions of the CSAE, 2010, 26(3): 243-248. (in Chinese with English abstract)
[5] José Sousa Camara, Maria Arminda Alves, José Carlos
Marques. Classification of Boal, Malvazia, Sercial and Verdelho wines based on terpenoid patterns[J]. Food Chemistry, 2007, 101(2): 475-484.
[14] 邵长军,李刚,李亮,等. 白酒香型与香味成分探究[J]. 酿
酒科技,2005,8:92-93.
Shao Changjun, Li Gang, Li Liang, et al. Investigation on liquor flavor types and flavoring components[J]. Liquor-making Science and Technology, 2005, 8: 92-93. (in Chinese with English abstract)
增刊2 霍丹群等:基于主成分分析和判别分析的白酒品牌鉴别方法 301
Recognition method of liquor brands based on principal component and
linear discriminant analysis
Huo Danqun, Zhang Miaomiao, Hou Changjun, Qin Hui, Yin Mengmeng,
1
1
1
1
1
Shen Caihong2,3, Zhang Suyi1,2, Lu Zhongming1,2, Zhang Liang2,3
(1. Key Laboratory of Biorheological Science and Technology of Ministry of Education,
College of Bioengineering, Chongqing University, Chongqing 400044, China; 2.National Engineering Research Center of Solid-State Brewing, Luzhou 646000, China;
3. Luzhoulaojiao Group Co., Ltd. Luzhou 646000, China)
Abstract: Flavor substances determine the difference of the liquors. A recognition method for liquor brands
discrimination was developed based on gas chromatography (GC) detection combining with pattern recognition in this study. First, 70 samples’ GC data from seven liquors were collected. Ten kinds of basic flavor substances including ethyl caproate and ethyl lactate were analyzed qualitatively and quantitatively. Then, principal components analysis was used to testify the discrimination ability based on the GC quantitative data of the 10 flavor substances. Finally, linear discriminant analysis was used to establish discriminant functions in order to differentiate the liquors. The results showed that both methods can differentiate liquors. In principal components analysis, the first three principal components accounted for 86.527% of total variation, which can effectively describe the complicated relationship between flavor substances and products. The precision rate of linear discriminant analysis was 100%, which can correctly discriminate all the samples, and the correct discriminate rate for new samples is 93.9%. The results show that established discriminant functions can effectively differentiate liquors. According to the study, the method of GC technique combining with pattern recognition can be used to identify and differentiate liquors.
Key words: gas chromatography, flavor, principal component analysis, linear discriminant analysis, liquors
因篇幅问题不能全部显示,请点此查看更多更全内容