您好,欢迎来到欧得旅游网。
搜索
您的当前位置:首页一种SVM不平衡分类方法及在故障诊断的应用

一种SVM不平衡分类方法及在故障诊断的应用

来源:欧得旅游网
第l6卷第9期 电 机 与 控 制 学 报 ELECTRIC MACHINES AND CONTROL Vo1.16 No.9 2012年9月 Sep。2012 一种SVM不平衡分类方法及在故障诊断的应用 王德成,林辉 (西北工业大学自动化学院,陕西西安710072) 摘要:针对支持向量机不平衡样本分类倾斜性问题,提出一种欠采样支持向量机分类器。构建包 含少类样本的最小封闭超球体,计算各个多类样本到包含少类样本最小封闭超球体球心的距离,利 用该距离对多类样本进行欠采样,产生新的训练集,实现韧I练集的平衡。该方法和其他不平衡分类 方法在基准数据集的分类结果表明该方法在识别率和分类速度方面的有效性。将该方法应用于永 磁同步电机驱动电路功率开关管开路故障诊断中,结果表明该方法缩短故障分类器的训练时间,提 高了故障分类器的泛化能力和诊断速度。 关键词:支持向量机;不平衡分类;欠采样;永磁同步电机;故障诊断 中图分类号:TM 306 文献标志码:A 文章编号:1007—449X(2012)09—0048—05 Imbalanced pattern classiicatifon method based on support vector machine and its application on fault diagnosis WANG De—cheng,LIN Hui (School of Automation,Northwestern Polytechnical University,Xi’an 710072,China) Abstract:Aiming at suppo ̄vector machine solving imbalanced pattern classiifcation tip problem,an im— balanced pattern classification method for support vector machine was proposed,basing on under-sam— piing.Hyper—sphere that contained small class samples with minimum volume was constructed.The dis・ tances between each sample of big class to hyper—sphere center were computed.According to above dis— tanees,under—sampling was carried out on big class.The balanced training set was formed.Simulations on benchmark dataset orf classiifcation showed the effectiveness of the proposed approach on classiifcation accuracy and classiifcation speed,compared with other imbalanced pattern classification method.This approach was applied on fault diagnosis of permanent magnet synchronous motor driving circuit power de- vice open fault.Experiment result shows that the proposed approach can reduce training time,and im— prove generalization ability and diagnosis speed. Key words:support vector machine;imbalanced pattern classification;under-sampling;permanent mag- net synchronous motors;fauh diagnosis o引言 随着航空科学技术的发展以及对新一代武器性 收稿日期:2011一o9—26 基金项目:西北工业大学科研启动基金(GAKY3006) 妻 慧 篡 . 蓑 采用永久磁铁产生气隙磁通而不需要外部励磁,具 作者简介:王德成(1981一),男,博士,讲师,研宄方向为电机控制、故障诊断; 林辉(1957一),男,博士,教授,博士生导师,研究方向为电机控制、非线性控制。 通讯作者:王德成 第9期 王德成等:一种SVM不平衡分类方法及在故障诊断的应用 49 有极好效率特性、极高功率密度以及转矩/惯量比等 优点,成为电动舵机驱动电机首选。永磁同步电机 驱动电路在运行过程中,常出现驱动电路故障 。 驱动电路故障会导致输出波形畸变,严重影响电机 的转速和输出转矩,使得电动舵机性能下降。研究 永磁同步电机驱动电路故障诊断,有助于提高电动 舵机的性能。 支持向量机(support vector machine,SVM)是一 种基于结构风险最小原理的机器学习方法 。他 通过非线性映射将输入向量映射到高维特征空间 中,然后在此构建最优分类面。该分类面不仅能够 尽可能多的将两类数据点正确的分开,同时使分开 的两类数据点距离分类面最远。SVM在解决小样 本、非线性及高维模式识别问题中表现出许多特有 的优势,在故障诊断领域得到很好的应用 j。 由于故障样本难以获得,训练集中不同类别之 间的故障样本数量很难达到一致,即样本集呈现不 平衡分布特性。各类样本数量不同时,SVM预测过 程具有倾斜性,对样本数量多的类别,其训练误差和 预测误差小;而对样本数量少的类别,其训练误差和 预测误差大_6—7 3。不平衡数据分类方法大致可分为 两类:基于算法层面的方法和基于数据层面的方 法 。基于算法层面的方法则是通过改进SVM 的分类算法,使之能够解决不平衡问题 。基于 数据层面的方法是对数据进行重采样以改变不平衡 数据集的分布,然后对重采样后的数据集进行分类 学习。欠采样方法通过对多类样本进行欠采样,缓 解不平衡数据对SVM分类方法造成的影响。与其 他方法相比,该类方法可以缩减训练集,提高训练速 度。最简单的欠采样方法是通过随机地去掉一些多 类样本来减小多类的规模,缺点是会丢失多类的一 些重要信息lL8 J。目前,研究学者提出许多欠采样方 法。Tomek links欠采样方法,通过删除多类中的噪 声样本,建立新的训练集 。CNN欠采样方法,利 用1一NN对训练集进行分类,剔除错分的多类样 本 。OSS欠采样方法对数据集先采用Tomek links方法处理,然后采用CNN处理 J。KNN欠采 样方法,寻找每个多类样本的3个近邻点,若至少2 个近邻点为少类样本,剔除该多类样本 1 。NCL欠 采样方法,先采用KNN对数据集进行处理,然后剔 除属于少类样本近邻点的多类样本¨ 。文献 [14]提出了一种基于遗传算法的欠采样方法,找出 噪声样本并将其去除。文献[15]提出了一种基于 聚类的欠采样方法,先用聚类的方法将训练集划分 成几个簇,然后对簇中的多类进行欠采样。 针对SVM在样本不平衡情况下的预测倾斜性, 提出一种基于多类样本到包含少类样本最小封闭超 球体球心距离的欠采样方法,形成训练集,降低 SVM训练过程中样本数量差异造成的影响,提高整 体的分类精度。将该方法应用于永磁同步电机驱动 电路功率开关管开路故障诊断中,有效地实现故障 快速诊断。 1支持向量机 给定一个两类分类问题,训练样本为( i,Y ), 其中i=1,2,3,…,n, l∈R ,Y‘∈{一1,1}。通过一 个非线性映射 将输入样本空间映射到一个高维 特征空间,然后在高维特征空间构造线性分类函数 )=sgn(W・咖( )+b)。 (1) 引入软间隔,根据结构风险最小化原则,要解决的原 始最优化问题形式为 寺l lII +c , s y (< ’ >+6)≥ 一 ,l (2) ≥0。 J 目标函数式(2)中,C称为误差惩罚因子,他实 际上起控制对错分样本惩罚程度的作用,实现在错 分样本的比例和算法复杂度之间的折衷。最小化这 两项的加权之和体现了结构风险最小化的思想。约 束条件中松弛因子基体现了软间隔的应用。 根据对偶原理得到对应的优化问题,即 ・ n n S(w,b, , ,p)= 1 } I+c∑ 一∑P 一 ∑0Li( i(< ・ >+6)一1+ ) (3) 在鞍点处由 、b、 的梯度为零,可得 W=∑oi=l tiy , ∑otiy =0, (4) i=1 C一 —P =0o 将式(4)带人式(3),可得对偶问题为 n x 一寺 ,, ”K( ), s 0,1 (5) 0≤ ≤Co J 其中,为核函数。通过求解式(5),得到0c的最优解 Od ,则 50 电机与控制学报 第16卷 =∑OLi Y , 1I (6) 因此可以通过多类样本到少类样本最小封闭超球体 球心的距离,提取新的多类样本。该欧式距离的平 方可表示为 一b=y』一∑Yi K(x )。J 最优分类面决策函数为 rll =(咖(勺),∑ ( ))=( (0),(6(0))+ E=J )=sgn(∑ yiK(x )+b)。 (7) (∑ 地),∑ =1 0=l ))一 2一种SVM不平衡分类方法 2.1 包含少类样本的最小封闭超球体 求解包含m个少类样本的最小封闭超球体可 以转化为最优化问题,即 mrRi n R +C ∑ ,,,f i=l st X,i)一r II ≤ + (8) ≥0。 其中, ( )为样本的 在特征空间的映射。构造 式(8)的拉格朗日函数为 r,R, ,卢,q)=R +C ∑ 一∑q + ∑/3 [1I咖( )一r Il 一R 一 ], (9) 在鞍点处南r、 、 的梯度为零,可得 ∑ ( ( )一r)=0, i=l ∑/i=l 3 =0, (10) C 一/3 —q =0。 式(10)对应的对偶问题为 JB ( 。)一 ∑卢 ( ) j=lm ∑Ji=I B =1 0≤/3 ≤C 。 求解最优化问题式(11),可得最优解 的值。最小 封闭超球体的球心为 r=∑卢 ( )。 (12) 2.2平衡训练集生成 南SVM训练得到的决策函数可知,决策函数取 决于支持向量。远离最优分类超平面的样本所对应 的冈子 =0,对决策函数没有贡献,因此可将这些 远离最优分类超平面的样本,从训练集中剔除形成 新的训练集。这些样本在高维空间远离少类样本。 2((b( ),∑ ( ))= ( , )+ ‘ I m m ∑∑ K xI=1 f=1  )一2∑ i=l x , )。(13) 3数值分析 实验以UCI机器学习数据库 钊中Statlog数据 集的分类问题为例,验证所提方法(MHSC)在不平 衡数据集SVM分类性能。有鉴于OSS欠采样方法 融合了NCL欠采样方法和Tomek links欠采样方法 的优点,实验中还采用了OSS欠采样方法。核函数 对核学习的泛化能力有很大的影响。高斯核是应用 于SVM的首选。实验中选用高斯核函数。训练集 的少类样本由20个样本构成。训练集的多类样本 由80个变化到100个时,两种不平衡分类方法对应 的SVM分类器在测试集样本的正确识别率如图1 所示。在酷睿双核i3M370,主频2.4GHz,内存2GB 配置的计算机上,两种不平衡分类方法对应的SVM 分类器在测试集样本的分类时间如图2所示。 对比图1,相对于OSS—SVM,MHSC—SVM具 有较好的正确识别率。该方法考虑SVM最优分类 超平面和训练样本的关系,通过舍弃远离包含少类 的最小封闭超球体球心的样本,建立平衡的训练集, 进行学习。图2中,相对于OSS—SVM,MHSC— SVM具有更快的分类速度。SVM分类器的分类速 度取决于支持向量的数目。因此MHSC—SVM对应 的支持向量数目较少,能够有效提高分类速度。 \ 料 器 样本数目 图1两种方法在不同多类样本数目下对应的正确识别率 Fig.1 Recognition accuracy of two methods with different big class sample number 第9期 王德成等:一种SVM不平衡分类方法及在故障诊断的应用 5 1 厘 莒 样本数目 图2两种方法在不同多类样本数目下对应的 测试集样本分类时间 Fig.2 Classification time of two methods based on testing set with different big class sample number 4 MHSC-SⅥ 在故障诊断中的应用 近年来,随着永磁材料和变频调速技术的发展, 永磁同步电机成为高性能伺服系统的主体,是电动 舵机驱动电机的首选。电压型逆变器由于其主电路 结构简单、控制电路灵活等优点,成为永磁同步电机 驱动电路的首选,其性能的好坏直接影响着整个系 统的运行质量。驱动电路在运行过程中,常出现由 于机械振动、过载、高温、腐蚀、元器件过热等情况造 成驱动电路故障。其中,由于功率开关管工作在高 频状态,以几千赫兹以上的频率连续的进行开通和 关断交替动作,发热严重,损耗较大,发生故障的概 率最大,并且以功率开关管的开路故障最为常见。 同时,为了使得功率开关管工作在低电压饱和导通 状态,必须为功率开关管提供合适的删极电压。栅 极电压信号的失效,也会产生功率开关管的开路 故障。 实验采用的永磁同步电机为面装式三相永磁同 步电机,极对数为2,额定电压27 V。逆变器由6个 功率开关管搭建。控制策略采用i =0的矢量解耦 控制。考虑到矢量解耦控制只需要A相电流和B 相电流,因此以绕组的A相电流和B相电流作为故 障诊断的故障信息。由于MOSFET栅极信号的失 效,会导致功率开关管的开路故障,因此通过控制 MOSFET栅极信号模拟功率开关管的开路故障。 永磁同步电机驱动系统功率开关管开路故障分 类器包含7类模式,即6个功率开关管开路故障状 态以及电机正常运行状态。选取定子A相电流和B 相电流作为故障信息。对电流信号计算其功率谱, 作为故障特征向量。采用二叉树支持向量机实 现故障诊断的SVM多模式分类问题。其中最底层 二叉树的叶结点对应各个功率开关管开路故障样 本;最高层子支持向量机最先诊断出电机是否处于 正常运行状态。 采用的下桥臂故障样本为10个。采用的正常 运行状态的样本数目和上桥臂故障样本数目相同。 不同的上桥臂故障样本数目下,针对含有各类样本 数目相同的测试集,采用MHSC—SVM和SVM得到 的正确识别率如图3所示。在酷睿双核i3M370,主 频2.4GHz,内存2GB配置的计算机上,采用MHSC —SVM和SVM对应的故障分类器决策函数训练时 间如图4所示。采用MHSC—SVM和SVM对应的 诊断时间如图5所示。 斟 器 样本数目 图3不同上桥臂故障样本下两种方法对应的正确识别率 Fig.3 Recogniiton accuracy of two methods under different upper bridge fault sample number 由图3可知,较SVM故障分类器,基于MHSC —SVM的故障分类器在不同的不平衡样本集下,具 有更好的正确识别率,使得故障分类器具有好的泛 化能力。这是因为MHSC—SVM能够对多类样本进 行欠采样,补偿训练集不平衡所带来的决策函数预 测倾斜性。 样本数目 图4不同上桥臂故障样本下两种方法对应的训练时间 Fig.4 Training time of two methods under different upper bridge fault sample number 由图4可知,基于MHSC—SVM的故障分类器 所对应的训练时间更小。虽然MHSC—SVM在训练 数据的选择上,需要求解二次规划问题,但是该二次 52 电机与控制学报 第16卷 规划问题是基于少类样本的。多类样本缩减后,会 ure of statistical learning theory[M].New [4] VAPNIK V.The nat提高SVM训练的训练速度。 s/垦留落 样本数目 图5不同上桥臂故障样本下两种算法对应的诊断时间 Fig.5 Diagnosis time of two methods under diferent upper bridge fault sample number 由图5可知,基于MHSC—SVM的故障分类器 所对应的诊断时间更小,应用时会降低CPU负担。 这为MHSC—SVM故障分类器提供应用基础,尤其 是在基于永磁同步电机的余度舵机余度切换上。 5 结 语 根据多类样本到包含少类样本最小封闭超球体 球心的距离,构建新的训练集,然后通过SVM训练 得到相应的决策函数,解决SVM不平衡样本预测倾 斜问题。将该方法应用于永磁同步电机驱动系统功 率开关管开路故障分类器中,结果表明该方法能够 提高诊断精度,缩短训练时间和诊断时间。 参考文献: [1] STEININGER A.Testing and build・in self-test*a survey[J].Jour- nal of System Architecture,2000,46(9):721—747 [2] MOHAMED A A,MEDHAT M M.Automatic diagnosis and loca— tion of open ・switch fault in brnshless dc motor drives using wave-- lets and neuro—fuzzy systems[J].IEEE Transactions on Energy Conversion,2006,2(1):104—111 [3] 崔博文.逆变器供电的感应电机驱动系统故障仿真研究[J]. 电机与控制学报,2007.11(6):578—583. CUI Bowen.Simulation study for inverter-fed motor drive system under fault conditions[J].Electric Machines and Control,2007,1 1 (6):578—583. York:Springer,1995:123—170. [5] 王强,陈欢欢,王埏.一种基于多类支持向量机的故障诊断算 法[J].电机与控制学报,2009,13(2):302—306. WANG Qinag,CHEN Huanhuan,WANG Ting.Multi-class sup— port vector machine for fault diagnosis[J].Electric Machines and Control,2009,(2):302—306. [6] LIN Y,LEE Y,WAHBA G.Support vector machines for classiif・ cation in nonstandard situations[J].Machine Learning,2002,46 (2):191—202. [7] REHAN A,STEPHEN K,NATHALIE J.Applying support vector machines to imbalanced dataset[C]//Proceedings of the 15th Eu— ropean Conference on Machine Learning.Pisa:Springer,2004:39 —50. 一一l 8 l KUBAT M,MATWIN S.Addressing the Course of imbalaneed training sets:one-sided selection[C]//Proceedings of the 9th European Conference on Machine Learning.Prague:Springer, 1997:179—186. [9] LIN Chun ̄,WANG Shengde.Fuzzy support vector machines [J].IEEE Transactions on Neural Networks,2002,13(12):464 —471. [10] TAO Qing,WU Gaowei,WANG Feiyue,et a1.Posterior proba— bility support vector machines for unbalanced data[J].IEEE Transactions on Neural Networks,2005,16(6):1561—1573. TOMEK l_Two modiifcations of CNN f J].IEEE Transactions on Systems,Man and Communications,1976,6(11):769—772. [12] BATISTA G E A P A,PRATI R C,MONARD M C.A study of the behavior of severla methods for balancing machine learning training data[J].ACM SIGKDD Explorations Newsletter,2004,6 (1):20—29. [13] LAURIKKALA J.Improving identiifcation on diifcult small clas— ses by balancing class distirbution[C]//Proceedings of 8th Con— ferenee on Artiifcila Intelligence in Medicine in Europe.Cascais: Springer,2001:63—67. [14] GARCIA S,HERRERA F.Evolutionary undersampling ofr clas— sification with imbalanced datasets:proposals and taxonomy[J]. Evolutionary Computation,2009,17(3):275—306. [15] YEN H J,LEE Y S.Cluster—based under—sampling approaches ofr imbalanced data distirbutions[J].Expert Systems with Ap- plications,2009,36(3):5718—5727. [16] UCI Benchmark Repository[EB/OL].http://www.ics.uci. edu/mlearn.html (编辑:于智龙) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- ovod.cn 版权所有 湘ICP备2023023988号-4

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务