第37卷 第12期数字技术与应用第 37 卷 数字技术与应用 www.szjsyyy.com2019年 12月Digital Technology &ApplicationVol.37 No.12December 2019算法分析DOI:10.19695/j.cnki.cn12-1369.2019.12.66基于数据挖掘的户变拓扑关系辨识算法研究*谷海彤 张远亮 卢翔智 崔卓 杜锦阳(广州供电局有限公司,广东广州 510620)摘要:户变拓扑关系的准确识别一直是电网运营过程中一个亟待解决的难题,从技术上寻求台区户变拓扑关系信息识别的方法已迫在眉睫。针对智能电网中部分集采台区存在户变关系混乱的情况,本文利用数据挖掘技术对电力通讯载波信号数据进行分析,基于增量式决策树算法设计了台区户变拓扑关系的辨识方法,实现了户变拓扑关系及时准确的维护。实际运行结果表明:该模型较之传统的决策树算法和贝叶斯模型具有更高的准确度,能有效提高台区用户信息识别的实时性和可靠性。关键词:数据挖掘;户变拓扑关系识别;通讯载波中图分类号:TM76文献标识码:A文章编号:1007-9416(2019)12-0116-020 引言计量自动化系统是智能电网的重要组成部分,然而由于多种因素,投入运行的部分集采台区存在户变关系混乱的情况,影响台区线损分析等关键技术指标,进而阻碍了计量自动化系统的推广应用。近年来,数据挖掘、机器学习等智能技术的发展为实现台区户变关系的识别提供了诸多行之有效的方法,这些理论和技术已经在电网运营中取得了成功的经验,例如,将数据挖掘应用于智能电网,邹云峰邓利用K均值聚类(K-means)实现了台区合理线损预测[1]、张蓝宇等运用聚类算法和关联分析法,搭建了线损管控、评估与智能诊析模型实现了台区线损管理的快速诊断决策[2]。本文则利用与电网拓扑关系紧密相关的载波技术,基于通信载波中所能够提供的计量信息,提出了一种基于增量决策树算法的户变拓扑关系辨识方法,通过数据挖掘的方式建立户变拓扑关系的识别模型并对其进行维护,用以提升户变拓扑关系识别的准确率。1 系统工作原理本系统利用宽带载波技术,实现了基于增量式决策树算法的户变拓扑关系识别相关的设备,在电网运营具体实施时,主站发送开始台区识别指令,CCO将该指令转给户变识别设备,户变识别设备图1 台区识别流程启动阶段示意图图2 台区识别流程生成正确的表档案示意图收稿日期:2019-10-20*基金项目:中国南方电网有限责任公司科技项目“具有自我演化功能的低压电网拓扑全息重构技术研发与应用”(GZHKJXM2 0180036)作者简介:谷海彤(1977—),男,浙江温州人,硕士研究生,高级工程师,研究方向:用电信息采集与计量自动化。116Copyright©博看网 www.bookan.com.cn. All Rights Reserved.谷海彤 张远亮 卢翔智等:基于数据挖掘的户变拓扑关系辨识算法研究2019年第 12 期图4 三种算法的识别准确率比较图3 增量式决策树算法流程发射信号,由台区内宽带载波(STA)模块负责回应,CCO根据收到的上报数据利用决策树算法进行拓扑关系的自动识别,并与自己网内的拓扑档案进行比较,将分类异常的用户进行剔除.该过程主要分为两个阶段:第一阶段为启动阶段,其示意图如图1所示,待识别台区(A)中的集中器载波模块进行数据广播,要求站点启动台区识别功能,正常广播的数据,其他台区的站点也有可能回应。由抄控宝于过零点发射识别信号。该信号采用的频率和调制方式与正常PLC通讯方式不同。其内容为本台区通讯模块的SNID和工作模式。台区识别流程第二阶段为下发SNID并生成正确表档案,其示意图如图2所示,由台区A集中器模块发起读命令,来查看各节点回应信号并进行增量式决策树的识别算法,根据识别的分类结果,CCO模块会发现STA2_21属于异常分类,而STA1_24属于本区域的正常分类。于是可根据此结果生成正确的档案。因此节点STA1_24会知道自己的SNID已经错误,会主动退出台区B并加入台区A,如图2中灰色节点所示,即完成了台区的正确辨识。台区识别流程的结束由发起时定义的超时时间决定,目前一般定义为60分钟以内。台区识别结束后,所变更的台区对应关系会被恢复为与主站设置档案一致。即台区识别只提供正确的台区对应表,并不更改集中器档案,防止本地档案与主站不一致。图5 三种算法的耗时比较(单位:毫秒)辨识模型。该算法主要分为两个阶段,首先将样本训练集的一部分作为初始样本数据集来生成初始决策树T0;然后在初始决策树的基础上执行后续新样本的增量学习。假设根据某个样本数据集生成的决策树中一个节点属性空间为D,之后依据此样本数据集的属性空间和分类情况作为贝叶斯分类器的参数,当接收到新的样本数据后,对到达这个节点的样本数据进行朴素贝叶斯分类,这种节点称为贝叶斯结点。增量式决策树算法执行过程如图3所示[4],当产生一个新的训练集样本时,决策树算法将该实例与已生成决策树中划分的属性进行匹配,并在到达叶节点时终止操作。如果到达的节点不是贝叶斯节点,则需要判断该实例的划分是否正确。如果划分结果准确,则决策树的结构参数不会发生任何更改,否则,如果基于贝叶斯分类方法的结果比决策树分类方法更加准确,则将此节点转换为贝叶斯节点。如果该节点是贝叶斯节点,则结合实例更新修正该节点的贝叶斯参数。因此,可以根据上述流程,通过连续递归的方式构建增量式决策树。2 增量式决策树算法决策树分类算法是通过一系列规则对数据进行分类的过程,用于来发现数据中蕴涵的分类规则[3]。但是由于电网大数据的特性,数据集随时间推移不断增大,如果每次建模过程都需要对所有数据进行训练会大幅度增加算法的时空复杂度。理论上基于贝叶斯估计的增量学习分类器是解决这个问题的有效途径,该算法在已有数据集的基础上,仅针对新样本对原有模型进行更新,可以保证算法的快速性和有效性。因此本文考虑将两者相结合,建立户变拓扑关系的3 实验结果分析本文主要利用载波通信数据来对算法进行对比实验测试对某供电营业所所属45个台区户变拓扑关系进行了模型有效性的检验,测试数据中所有台区的用电客户数量为3846个,通讯载波信息记录数约为120万条。在网络的建立和测试过程中,利用电力载波通信信号品质数据作归一化处理作为训练样本输入数据,信号品质范围为0-1,选用本文提出的增量式决策树算法与经典决策树C4.5算法和······下转第236页117Copyright©博看网 www.bookan.com.cn. All Rights Reserved.第 37 卷 数字技术与应用 www.szjsyyy.com的提高,人们对于广告的要求逐渐提高。当前随着数字媒体技术的不断发展,观众的的需求逐渐的向多元化发展,传统的广告不再受到受众的欢迎,而带有画面感影视广告则受到观众的极大的欢迎,因此无论是何种类型的广告设计往往都会利用画面展示出最完美的广告画面,从而呈现出最佳的艺术效果。影视广告的剪辑内容有很多,因此利用相关的剪辑手段可以有效的优化广告素材,排除不必要的广告素材。影视广告的种类有很多,但是并不是每一类型的广告都会受到观众的喜爱,往往影视广告的风格类型会直接决定影视广告所能得到的收益,因此影视广告在设计的过程中需要丰富和优化广告的风格,追求良好的艺术效果,考虑观众的接受习惯。虽然广告的艺术效果极为重要,但是设计师在设计的过程中需要考虑到实际的情况,不能仅仅为追求艺术效果而放弃事物本来的面貌,这是极为错误的做法[3]。3 结语数字媒体技术是数字化时代时代的产物,也是媒体技术发展的趋势,相较于传统的媒体技术而言,数字媒体技术有着自身独特的优势。数字媒体技术在影视广告的设计中得到了极为广泛的运用,并且推动了影视广告设计的创新。本文简要的探讨了数字媒体技术在影视广告设计中的创新性发展,希望对影视广告设计的发展有所帮助。参考文献[1] 李金莉.基于数字媒体技术的影视广告设计[J].新闻战线,2015(5):127-128.[2] 熊波.新媒体时代中国电视产业发展研究[D].武汉大学,2013.[3] 薛莹莹.新媒体时代动画广告的应用优势[D].浙江工商大学,2013.Research on Innovative Development of Digital Media Technology in TelevisionAdvertising DesignDU Jia-xin(Changchun Institute of Architecture,Changchun Jilin 130000)Abstract:After the advent of the digital age, new developments have been made in all walks of life in the society, and a large number of emergingindustries have emerged in the society, which has injected new vitality into China's social and economic development. In this context, digital Mediatechnology has been fully developed. This article briefly discusses the innovative development of digital media technology in the design of film andtelevision advertising, hoping to help the development of film and television advertising design.Key words:digital media technology; film and television advertising design; innovation; development research······上接第117页贝叶斯分类算法的耗时以及准确率进行对比,测试户变拓扑关系识别模型的性能分别如图4和图5所示。实验中选取不同大小的数据集进行测试,横坐标中的数字1,2,3,4分别代表数据集大小为1000,5000,10000和20000。从图4和图5中可以看出,增量决策树算法在没有明显增加计算负担的前提条件下,其分类准确率比其他两种算法有明显提升,同时,随着数据量的增大准确率波动较小,体现了该算法优良的分类性能以及算法的鲁棒性。斯增量式学习融合,提出了基于载波技术的增量式决策树算法用以准确识别台区户变拓扑关系。测试结果表明该算法能够满足电力公司对户变拓扑关系识别精度的要求,在计量自动化系统的推广应用方面发挥了积极的作用。参考文献[1] 邹云峰,梅飞,李悦.基于数据挖掘技术的台区合理线损预测模型研究[J].电力需求侧管理,2015,17(4):25-29.[2] 张蓝宇,陈艺云,海入.基于数据挖掘技术的台区线损智能诊断研究及应用[J].湖南电力,2019,39(2):16-20.[3] 智华,赵春江,郭新宇.一种新的基于平衡决策树的SVM多类分类算法[J].控制与决策,2011(1):149-152.[4] 王明星.数据挖掘算法优化研究与应用[D].安徽大学,2014.4 结语本文面向台区户变拓扑关系的辨识问题,将决策树算法和贝叶Research on the Transformer Area Identification Algorithm Based on Data MiningGU Hai-tong,ZHANG Yuan-liang,LU Xiang-zhi,CUI Zhuo,DU Jin-yang(Guangzhou Power Supply Bureau Co., Ltd., Guangzhou Guangdong 510620)Abstract:The accurate maintenance of the topology relationship of the transformer area has always been a difficult problem for the power gridcompany. At present, technical breakthroughs must be sought to solve the bottleneck problem of accurately identifying the topology relationship acrossthe transformer area. In this paper, an incremental decision tree algorithm was proposed to identify the relationship based on the analysis of the powerline carrier communication technology through the data mining technology. The actual operation results showed that the model has the advantages ofhigh recognition accuracy than the Bayesian model and can effectively improve the real-time and reliability of user information identification.Key words:data mining;transformer area identification;power line carrier236Copyright©博看网 www.bookan.com.cn. All Rights Reserved.