以数据挖掘为核心的电力计量信息仓库模型分析

(整期优先)网络出版时间:2019-05-15
/ 2

以数据挖掘为核心的电力计量信息仓库模型分析

李枞

(广东电网汕头潮阳供电局有限责任公司)

摘要:在信息化时代的发展大环境之下,电力企业的良好稳定发展,对于信息化技术的应用能力有了越来越高的要求。电力企业在生产经营的过程中,需要针对业务范围中的信息化系统构建进行细致的研究和积极的应用。目前的发展阶段中,电力计量信息系统可以有效提升电力企业各项工作之间的联系紧密程度。设计公司可以通过构建信息系统模型,来规范电力企业的数据信息交流传递工作。本文将针对电力企业在经营管理中的以数据挖掘为核心的电力计量信息仓库模型进行分析,从体系结构的构建、功能性的设计以及模块化的实现等多个角度,对数据挖掘的可视化平台进行阐述,将CIM信息模型以及XML格式的文件作为数据挖掘平台的基层载体,可以适应越来越快的企业发展速度以及不断增长的用电量的查询管理的需求。

关键词:数据挖掘;电力测量;信息模型

随着我国社会经济的快速发展,无论是居民的日常生活,还是企业的正常经营建设,都逐渐增加了对用电量的需求【1】。在这样的发展背景之下,要求电力企业在经营管理的过程中,针对电力使用的系统管理积极进行研究。目前,电力系统的管理中,最常见也是最有效的方式就是构建完善的数据挖掘系统。数据挖掘系统在电力企业的管理中具有重要的意义,对于电力使用情况的评估、电力系统运行负荷的预测以及配电网发生的故障问题,数据挖掘系统都可以起到控制优化的作用。在接下来的发展过程中,电力企业需要不断对以数据挖掘为核心的电力计量信息仓库模型进行分析,才能应对电力数据信息不断增多、电力企业信息管理难度增大的发展现状和趋势【2】。

一、计量信息仓库模型相关概述

以数据挖掘为核心的电力计量信息仓库模型具体来说就是将电力企业的营销系统、电量系统、营配一体化以及EMS等部分,采用数据接口的统一型数据模型CIM的形式,通过ETL来进行数据信息的的提取、转换和加载,将数据准备、数据仓库的信息,复制到数据挖掘模型的多维分析平台上,最后将所有数据信息以元数据的形式提供给电力企业的ESB服务总线中。这样的数据挖掘模型,可以有效对数据进行二次处理,提升用户读取和查询的效率,在技术的先进性和开放性上取得了更高的成就【3】。图1即以数据挖掘为核心的电力计量信息仓库模型结构图。

图1以数据挖掘为核心的电力计量信息仓库模型结构

二、电力计量信息模型CIM

电力计量信息模型CIM可以提供数据信息之间清晰的联系,为信息仓库的构建提供了良好的基础。电量系统按照IEC61970-503设计的CIM/XML来制定了数据信息交换的格式,在全部应用程序间可以模型数据交换。电量程序里线路模型包含送电网络与配电网络两者,都是电容设备,可包括所有线路上的机器。在输电线路方面,线路通常包括交流线段和直流两部分。配电线路以类表述。送电、配电线路和变电站的联系的描述,可利用其含概的线路用拓扑计算得出。计量管控的逻辑结构,主要是由台区、计量点、表计资产、表计读书、计算值等方面组成的。计算点是电力计量信息数据模型中的核心内容,因此,计算点与其他对象均有着密切的联系,代表了电力系统中各种资源的子类,是多种表征计量点采集信息量测的集合。

三、数据挖掘

云计算工作中,大量的数据挖掘结构,是以云处理平台分布式信息HDFS为基础的。通过测量设计MapReduce和MPP信息仓库来并行实现。基于云计算的海量信息挖掘平台,包括云存储计算平台和挖掘算法两部分内容。海量信息挖掘平台在以下三个方面发挥作用:一是数据的预处理,主要是为外部系统提供数据的预处理,进行标准化额操作。二是云聚类分析,将预处理的数据集合起来,进行细致的分析后提供给外部系统。三是云分类建模,将预处理的数据进行分类预测建模,建立分类模型,把分类模块提供给云分类查询模块中。

数据挖掘结构是云储存功能和云数据挖掘的有效结合,数据挖掘结构是对各项工作操作步骤逻辑和规则的结合,提供了适合的数据算法模型、输出模型以及数据格式的转换计算方法。产生了适用信息式变换规则、并行任务统筹规范,在挖掘模块里用图像化的模式表述,同时可以将相关的逻辑与标准进行计算、监视与管控。

四、即席查询

即席搜索查询系统,就是把维度表与事实表转换到语义层,采用制作可视图的形式,让搜索查询系统的使用管理者可以通过更为直观的形式,让用户获得其需要的统计信息,有效提升了信息查询的方便快捷性。即席搜索查询的作用形式主要可以分为:应用层、语义层、服务层和信息层。即席搜索查询的工作程序为,在语义层上和将信息质量域整合,提供语义分析的能力。通过语义层中图像化的语义设计,利用语义的拖拉,来完成即席搜索的输入。在服务层收到转换后的语义后,在信息数据库中进行搜索,最后通过应用层的作用,来输出即席查询得出的信息数据。

(一)、语义层

语义层中的数据字段,主要面向的是用户。语义层的表达式可以是表、字段组合等多种形式。语义的转换其实就是将复杂的信息数据模式,投射成为熟悉的专业名词,可以便于没有相关操作经验的作业人员,直接从数据库中搜索到需要的数据。语义层的作用可以对电力企业的元数据信息进行集成化处理,获得信息库里有含义的信息模型。在语义的设计方面,针对已经被定义过的语义层模块,可以进行随意的组合,产生出相关决策要求的报表,同时将报表中的数据信息用更为直观可视的形式表现出来,既可以是表格的方式也可以是直接在电脑屏幕上呈现。在语义的拖拉与标准设计方面,语义的拖拉和设置等同于对数据库中数据查询和选择的定义。在即席搜索里,电量程序要求利用可视化的表述方式完成功能的实现。

(二)、服务层

即席搜索查询中的服务层具体来说就是将数据用直观的形式展现给用户,展现方式更符合用户的习惯。用户提出查询数据的申请后,系统首先需要将用户申请的语义进行转换,在对语义进行解释之后,得出系统可操作的SQL语句。程序中的语义转换就是通过语义层中储存的数据,对用户申请进行语义上的转换,得出可以执行的SQL语句。SQL的查询,就是将语义转换得出的SQL语句在数据库中进行查询,将查询得出的数据结果提供到数据层。用户在申请数据查询时,对于查询的工作效率通常有着较高的要求,由于用户的查询申请类型、需求多样,如果在一般的数据查询技术无法满足的情况下,可以采用数据缓存的方式,来提升数据查询的效率。

(三)、应用层

一般服务层提供的数据输出形式有直观报表、交叉报表、数据切片、数据钻取等。其中,直观报表即最基础的行列报表。交叉报表的表头与多行。数据切片形式的报表,就是针对表中的数据可以在某一个维度上,进行片段化的数据展现。数据钻取形式的报表,就是针对表中的数据可以在某一个主题下,进行不同维度之间的上钻和下钻。采用图表化的形式,则可以让数据报表更为可视化,图表的形式包括柱状、饼状、线性等。

(四)、数据层

即席搜索查询中的数据层的作用,就是挑选数据库中的数据进行提取。由于目前的电量查询工作对于信息仓库模型的技术需求较高,所以可以采用多维数据分析的技术,从多个维度对数据指标进行分析。多维数据分析技术既可以从单一的维度进行的分析,也可以进行几个维度的组合分析,操作方式包括切片、钻取等。

结语:电力企业为了应对快速增长的用电量以及各方面用户需求,需要积极对以数据挖掘为核心的电力计量信息仓库模型进行分析,针对信息仓库模型的开放性以及统一性进行合理规划。在电力计量信息模型CIM中实现数据的统一化处理。在数据挖掘方面,改进传统的数据挖掘方式无法对海量数据进行挖掘的不足,对海量的数据信息进行并行化处理,使用计算机技术进行集成、高效的的数据过程。在即席搜索查询方面,提升用户查询的效率,更快地获取用户所需要的信息数据。

参考文献:

[1]施亮.电网故障冲击对发电机组的影响及应对措施[J].通讯世界,2017(16):213-214.

[2]马丽强,王天正,杨冬冬,王志鹏.基于弱关联挖掘技术的电网故障自动诊断研究[J].现代电子技术,2016,39(10):152-155.

[3]陈莹.温岭市工业企业数据平台工作问题和对策研究[J].经贸实践,2016(03):281.