数据挖掘技术在电力企业大数据的应用

(整期优先)网络出版时间:2019-08-18
/ 2

数据挖掘技术在电力企业大数据的应用

王静存

国网太原供电公司030012

摘要:随着信息化技术的飞速发展,电力企业数据呈几何指数规模增长,如何从海量大数据中及时挖掘出隐藏信息和有效数据显得越来越重要。数据挖掘技术的产生和发展为解决电力大数据的分析处理提供了新的思路,使电力大数据更好地服务于电力企业和电力用户。

键词:数据挖掘技术;数据分析;营销抄核收;大数据;

1数据挖掘流程和方法

数据挖掘是一个利用数据分析工具在海量数据中发现模型和数据之间关系的建模过程,通过模型和数据之间的关系可以预测业务发展的趋势,寻找数据潜在关联,发现业务忽略因素和拓展新的业务强点。

1.1数据挖掘流程

跨行业数据挖掘标准流程(cross-industrystandardprocessfordatamining,CRISP-DM)是各行业数据挖掘标准过程的综合展示,它是一个可通过不断实践、不断完善的动态过程,具体包括商业理解、数据理解、数据准备、建立模型、模型评估和模型部署6个阶段。

(1)商业理解

从商业的角度出发,以商业目标为切入点,深入了解业务的诉求和最终目的,将业务诉求与数据挖掘的定义以及结果有效结合起来。

(2)数据理解

对业务中真实产生的数据按照业务场景以及业务诉求进行评估和选取。

(3)数据准备

对业务中可用的原始数据,按照业务模型进行有效的组织以及清洗,使之达到建模需求。

(4)建立模型

在此阶段需要选择和应用多种不同的建模技术,校准业务数据模型参数。本阶段主要完成数据模型建立、数据关联规则、数据分类与预测、数据业务聚类、数据异常检测等。

(5)模型评估

本阶段主要检测挖掘结果与业务目的的吻合度,检测数据模型是否满足业务诉求。

(6)模型部署

将数据模型进行应用实施,将数据挖掘结果生成一份报告。

1.2数据挖掘方法

(1)回归分析

回归分析是常用的预测性分析模型,其根据大量历史数据进行数据建模,在历史数据中寻找业务规律的判别方案,根据数据模型对业务运行规律在时间属性上的变化进行探索,推断出影响业务的因果线性关系,计算出线性回归方程,进而预测业务发展的趋势。

(2)聚类分析

聚类分析是根据业务数据找出有共同特点的业务对象,将不同特点的数据对象划分成不同类别,目的是通过聚类分析将数据库中的业务数据映射到某个定义的类别中,在分析应用时可以实现业务分类以及趋势预测等。

(3)神经网络

神经网络是模仿人脑神经网络的结构和工作机制而建立的一种计算模型,包括前馈式网络、反馈式网络和自组织网络模型。神经网络的优势是其具有良好的自组织、自适应、并行处理、分布存储和高度容错等特性。

2电力企业抄核收数据信息化现状及数据挖掘方法

2.1电力企业抄核收数据信息化现状

电力改革将电力企业带入了市场化阶段。电力企业的主营收入是电费,电费抄核收是电力企业营销业务领域的重要环节,是电价电费管理领域中最基础的工作,电费抄核收的管理水平和工作质量直接关系到电力企业的营收情况,同时影响着客户对电力企业的满意度,因此,加强电费抄核收管理工作并提高服务水平是电力企业重点发展方向。

2.2电力企业抄核收数据挖掘方法

通过跨行业数据挖掘标准流程中的商业理解、数据理解、建立模型3个关键步骤对营销抄核收数据开展分析。

(1)商业理解

抄核收工作是电价电费管理的重要环节。抄表环节是业务数据起源,准确梳理抄表数据可以减少电费核算的误差率;电费核算是抄核收业务处理的枢纽,电费核算的准确性影响着电费回收的准确性和及时性,通过电费核算数据可以精准分析营收电费中各行业的占比;收费是抄核收业务的最后环节,通过收费数据可以及时了解电力企业电费回收情况。

(2)数据理解

随着抄核收业务以及信息化技术的发展,抄核收数据呈现几何级增长的趋势,其数据特性满足大数据的5个特性:(1)Volume(大体量),抄核收数据包含用电户的抄表、核算、收费数据,每月数据增长量达千万级以上;(2)Variety(多样性),抄核收数据包含各种不同用电户的数据,数据格式和形态呈现多样性;(3)Velocity(时效性),抄核收数据需要按时处理才能满足电费回收的要求;(4)Veracity(准确性),抄核收数据与用电户的缴费以及电力企业的营收紧密相关,需保证其准确性;(5)Value(大价值),抄核收数据包含很多深度价值,通过对其进行分析挖掘和利用,可为电力企业管理及决策提供依据。

(3)建立模型

数据建模主要分为简单报表、数据集市、数据仓库3个阶段。根据营销抄核收业务管理特性,围绕抄核收业务中的核心数据建立对应的数据模型,通过数据模型对抄核收业务进行抽象以及处理,形成各个阶段的数据模型。

简单报表阶段:根据抄核收日常工作需要,形成抄核收业务人员在日常工作中的统计表格以及生产电力企业决策所需的汇总数据。

数据集市阶段:按照业务规则对抄核收数据进行采集、整理,提供多维报表、图表以及可视化的展现,支撑特定业务分析应用,并且能够提供直观的决策数据。

数据仓库阶段:建立固定的业务数据模型,按照业务数据模型对抄核收业务数据进行采集、整理,以满足不同业务部门需要,形成电力企业内跨部门流转的数据资产,通过数据仓库生成对抄核收业务具有指导性的数据,为电力企业运营决策提供强力的数据支持。

3抄核收数据挖掘应用情况

营销抄核收数据分析应用平台是一个采用数据挖掘方法对营销抄核收数据分析应用的平台,该平台具有可视化和报表统计功能。

(1)可视化

该平台根据数据模型关键因素提供可视化界面,数据展示更加清晰、简洁,业务人员可直观地查看到自己关注的数据。

(2)报表统计

提供对应的报表分析功能,满足业务人员日常报表制作需求,减轻业务人员工作量。如售电单价分析表可以按单位或者行业分类对售电平均单价进行比对,得到售电结构变化、单价变动拉动作用、共同拉动作用每月的同比数据。

4电力数据挖掘的应用前景

数据挖掘技术除了可以应用在营销抄核收业务领域,在其他领域同样可以发挥重要的作用。

(1)绘制用户画像,开展个性化营销

在海量的营销数据信息中应用数据挖掘技术提取用户的相关属性以及行为规则,进而绘制用户的画像信息,可以使电力企业划分出不同消费群体,根据不同消费群体的特性提供个性化服务。此外,用户画像信息可以使电力企业全面掌握重要用户的行为规则以及用电习惯,为制定不同重要用户的服务策略提供依据,保障重要用户的服务质量。

(2)基于数据挖掘技术的客户关系管理

随着电力行业的不断发展,电力用户服务逐渐成为电力企业竞争的核心。不同的用户其用电的习惯以及需求均不同,面对众多的电力用户,如何抓住用户的需求,为其提供更好的供电服务,成为电力企业的服务目标。通过数据挖掘技术建立客户信息、用电信息、检修信息等相关电力信息,将有相同用电需求的电力用户划分为同类别,通过向同类别的电力用户提供定制化的服务以及投放对应的广告,有助于提高客户满意度和忠诚度。

5结语

本文介绍了数据挖掘技术及其在电力抄核收业务中的应用情况。与传统的数据统计方式相比,数据挖掘技术具有更高的预测能力、计算能力和管理能力。在电力企业中应用数据挖掘技术深入分析业务数据,寻找业务数据的规律,可使电力企业充分了解不同电力用户的个性化需求,还能辅助电力企业从海量数据中挖掘出急需的数据,为电力企业改进决策、降低成本和提高效益提供依据。

参考文献

[1]陈星莺,张晓花,瞿峰,等.数据挖掘在电力系统中的应用综述[J].电力科学与技术学报,2007,22(3):51-56.

[2]曾碧波,黄小红,赵健伍,等.TPSSCADA系统中基于电能分析的数据仓库模型设计[J].工业控制计算机,2009,22(9):37-39.

[3]周广惠.对企业用电量分析与预测的数据挖掘[J].装备制造技术,2009,37(9):110-112.