数据挖掘在智能电能表故障分析中的应用思考
摘要
关键词
智能电能表;数据挖掘;故障分析
正文
1数据挖掘技术的基本内涵
数据挖掘实则需要一定的过程,其以系统为基础。将数据挖掘形象的称为知识发现。当然,这种说法是有一定依据的。首先了解到现实中所出现的数据具有不同的层级,且这些层级数据分别具有隐性或显性特征。现实中很容易获取显性特征,但是却无法把握数据隐形特征。隐性特征才是最主要的信息,通过这些信息的获取和判断才能够完成后期工作的处理。
2数据挖掘在智能电能表故障分析中的具体应用
2.1故障数据收集
建立运行电能表故障数据库,需要收集分拣系统、质检实验室数据、运行区域数据、营销业务系统和MDS系统中故障数据信息。电能表故障数据库具有数据量大、信息准确、同步更新、不断完善等重要特点。
(1)分拣数据库数据
从分拣数据库中获取电能表的分拣数据信息:分拣实验项、分拣结论、故障原因、故障类型、处理意见等信息;分拣系统提供此数据库存储规约,电能表故障数据库系统通过规约解析分拣数据并存储到本地数据库。分拣系统将电能表分拣实验项数据、分拣结论、故障原因、故障类型等信息写入到分拣数据库中,电能表故障数据库系统根据分拣系统提供的数据库格式直接读取分拣数据库中的数据信息。
(2)营销或MDS数据
通过接口从营销系统或MDS中获取拆回故障表的资产编号,并根据资产编号获取营销系统中的拆回原因及故障原因、故障类型、中标批次、到货批次、供应商、所属单位、接线方式、类型、电压、电流、准确度等级等数据信息,存储在新的表计信息列表中方便后续统计分析使用。
2.2搭建故障数据分析框架
基于电能表故障数据库提供的故障数据,首先对收集到的各类故障数据和对应的电能表基本数据进行标准化处理,使其能够满足数据分析模型的基本要求;然后,在标准化数据的基础上,采用关联分析方法建立电能表故障分析模型,分析基本属性与故障类型之间的相互关联关系,找到计量资产的家族性缺陷;最后,持续开展数据模型的校核、验证和模型训练,逐步修订完善分析模型,使其达到分析结果真实可靠的目的。
2.3数据分析模型
2.3.1构建项集组合
项集组合即所有可能同时出现的属性组合,根据数据整理的结果,对可用来分析的数据项进行筛选,分别建立上述项集组合。以故障数据中的任意项属性值(可假设为属性0,属性1,属性2,属性3)为例,图1显示了所有属性之间所有的可能组合(称作项集组合)。利用这一方法,可进一步建立包含所有故障类型和属性值的项集组合。
图1所有属性之间所有的可能组合
2.3.2生成频繁项集
频繁项集是经常同时出现的属性的集合。只有频繁出现的数据项才能够解释现象之间存在的内部关联。首先需要计算每个项集的支持度,据此找到频繁项集,然后再从频繁项集中挖掘关联规则[3]。项集数目庞大,在数量级的数据上实现建模过程非常困难,因此首先从海量数据中选取一个局部的数据,在局部数据上建立本项目的关联分析模型并进行试算,然后再采用特定软件和算法将局部模型推广到全局。
2.3.3集中挖掘关联规则
在给出频繁项集的同时,也给出了频繁项集对应的可能的关联规则。计算这些关联规则的可信度。可信度表示在先决条件X发生的情况下,由关联规则“X→Y”推出Y的概率。即在含有X的项集中,含有Y的可能性,公式为:Confinence(X→Y)=P(Y|X)=P(X,Y)/P(X)=P(X∪Y)/P(X)。
计算可信关联规则的提升度。提升度表示在含有X的条件下,同时含有Y的概率,与含Y的概率之比。Lift(X→Y)=P(Y|X)/P(Y)P(Y|X)/P(Y)称为X条件对于Y事件的提升度,如果该值=1,说明两个条件没有任何关联,如果<1,说明X条件(或者说X事件的发生)与Y事件是相斥的,一般在数据挖掘中,当提升度大于3时,研究人员才承认挖掘出的关联规则是有价值的。
2.3.4关联分析方法
(1)列表法将实验数据按一定规律用列表方式表达出来,是记录和处理实验数据最常用的方法。表格的规范要求对应关系清楚、简单明了、有利于发现相关量之间的物理关系;此外还要求在标题栏中注明物理量名称、符号、数量级和单位等;根据需要还可以列出除原始数据以外的计算栏目和统计栏目等。
(2)作图法可以最醒目地表达物理量之间的变化关系。从图线上还可以简便求出实验需要的某些结果(如直线的斜率和截距值等),读出没有进行观测的对应点(内插法)或在一定条件下从图线的延伸部分读到测量范围以外的对应点(外推法)。
结语
先进的技术能够为实际工作开展提供便利。在电力领域充分利用数据挖掘技术完成智能电表故障统计分析,工作人员的工作压力有所减轻,工作失误率下降。数据挖掘技术的优势非常明显,行业对于技术的认可程度较高。考虑到数据挖掘技术的价值,电网公司应当在原有的基础上更加深入地进行深层次内在关系发掘,通过有效信息的获取来为现实工作提供重要支撑。
参考文献
[1]祝宇楠,徐晴,刘建,等.数据挖掘在智能电能表故障分析中的应用[J].电力工程技术,2016,35(5):19-23.
[2]贺宁.智能电表故障大数据分析研究[J].中小企业管理与科技旬刊,2016(19):142-145.
[3]张广斌.基于数据挖掘在智能电能表故障分析中的应用[J].百科论坛电子杂志,2018,(1):319.
...