數(shù)據(jù)挖掘在電力營銷中運用現(xiàn)況

時間:2022-04-07 10:30:00

導語:數(shù)據(jù)挖掘在電力營銷中運用現(xiàn)況一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘在電力營銷中運用現(xiàn)況

如何從海量的電力營銷數(shù)據(jù)中提取出有價值的信息,進而快速地為決策者提供盡可能準確、翔實的等量化指標和決策數(shù)據(jù),提高經(jīng)營管理水平,指導電網(wǎng)的經(jīng)濟運行工作,是目前信息技術在電力營銷系統(tǒng)應用中面臨的主要問題。數(shù)據(jù)挖掘(DataMining,DM)技術的出現(xiàn),無疑將在電力營銷領域引起一場革命性的變革。本文從電力營銷系統(tǒng)的重要性入手,介紹數(shù)據(jù)挖掘的技術特點及其在電力營銷系統(tǒng)的應用現(xiàn)狀,從而為電網(wǎng)的經(jīng)濟運行提供決策依據(jù)。

1電力營銷系統(tǒng)

電力營銷系統(tǒng)以業(yè)擴報裝、電能計量、用電管理、營業(yè)計費和線損管理等關鍵業(yè)務為核心,在各業(yè)務模塊之上提供服務模塊和分析模塊。服務模塊包括電話服務、因特網(wǎng)服務和客戶中心服務等,側重于為電力用戶提供各種快捷優(yōu)質的服務;而分析模塊則包括綜合業(yè)務查詢、基于歷史數(shù)據(jù)的統(tǒng)計、效益分析和決策支持,側重于為企業(yè)領導提供及時準確的決策依據(jù)[1]。因此,一切為電力系統(tǒng)正常運行提供決策的原始數(shù)據(jù)都可歸結為營銷數(shù)據(jù)范疇,比如生產(chǎn)系統(tǒng)規(guī)劃設計、負荷預測及用戶特征提取、經(jīng)濟調度、電力系統(tǒng)故障診斷、動態(tài)安全評估、異常數(shù)據(jù)的挖掘及相應處理等。

1.1營銷系統(tǒng)數(shù)據(jù)來源

營銷系統(tǒng)的海量數(shù)據(jù)由管理信息系統(tǒng)、地理信息系統(tǒng)、SCADA系統(tǒng)以及電網(wǎng)運行的實時信息系統(tǒng)(負荷管理系統(tǒng)、電能量計費系統(tǒng)、配變檢測系統(tǒng)、計量檢定)的運行數(shù)據(jù)所組成。隨著電力企業(yè)信息化建設的快速發(fā)展,各系統(tǒng)已產(chǎn)生并積累了較為龐大的歷史數(shù)據(jù)。

1.2營銷系統(tǒng)的數(shù)據(jù)特點

(1)數(shù)據(jù)多。在電力營銷系統(tǒng)中,數(shù)據(jù)主要分為由各種裝置實時采集的現(xiàn)場數(shù)據(jù)和由調度中心多種系統(tǒng)在運行過程中產(chǎn)生的大量數(shù)據(jù),數(shù)據(jù)來源多。另外,電力系統(tǒng)屬于大規(guī)模奇異非線性動態(tài)大系統(tǒng),在對其進行特征描述時往往涉及到上千個狀態(tài)變量。傳統(tǒng)的處理方法是對系統(tǒng)進行降維或簡約化處理,這在一定程度上影響了最終結果的精度[2]。

(2)數(shù)據(jù)種類混雜。營銷系統(tǒng)是一個標準的混雜系統(tǒng),其上層(如調度中心)給出的(調度)決策主要是邏輯性的操作指令,而下層控制(如發(fā)電機的勵磁與調速控制)主要是連續(xù)性的,為了達到系統(tǒng)多目標優(yōu)化控制的目的,應將不同性質的上層和下層控制有機地對合起來。

(3)數(shù)據(jù)質量差。在營銷系統(tǒng)中,采集到的數(shù)據(jù)往往存在含有噪聲、缺失、不正確等情況。

(4)對數(shù)據(jù)的要求高。當系統(tǒng)處于緊急狀態(tài)甚至瓦解狀態(tài)時,必須制定實時在線快速決策,使系統(tǒng)重新回到正常狀態(tài)。

2數(shù)據(jù)挖掘技術

數(shù)據(jù)挖掘又被稱為數(shù)據(jù)庫中的知識發(fā)現(xiàn)(KDD),是數(shù)據(jù)庫發(fā)展與人工智能技術相結合的產(chǎn)物,是一門新興學科。它集統(tǒng)計學、模式識別、人工智能、機器學習、數(shù)據(jù)庫以及高性能并行計算等技術于一體,把人們對數(shù)據(jù)的應用從低層次的簡單查詢提升到從數(shù)據(jù)中挖掘知識,為管理者提供決策支持,具有極為廣泛的應用前景,是當前國際上數(shù)據(jù)庫和信息決策領域的最前沿研究方向之一。

2.1數(shù)據(jù)挖掘的基本概念

數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識的過程[3]。利用數(shù)據(jù)挖掘技術可以對電力營銷系統(tǒng)產(chǎn)生的海量數(shù)據(jù)進行分類抽取與優(yōu)化整合,合理存儲后實時計算出相關指標以提取所關心的營銷信息,其結果將對營銷系統(tǒng)的決策起到數(shù)據(jù)支持作用,更好地指導企業(yè)的管理層和決策層對變化的環(huán)境做出快速而科學的市場營銷決策。

2.2數(shù)據(jù)挖掘的主要技術[4]

(1)關聯(lián)規(guī)則。關聯(lián)規(guī)則是數(shù)據(jù)挖掘中最活躍的研究方法之一,最早是由AGREWAL等人針對購物籃分析提出來的,采用經(jīng)典的Apriori算法,從大量的數(shù)據(jù)中挖掘出描述數(shù)據(jù)項之間相互聯(lián)系的有價值知識。隨著收集和存儲在數(shù)據(jù)庫中的數(shù)據(jù)規(guī)模越來越大,人們對從這些數(shù)據(jù)中挖掘相應的關聯(lián)知識越來越有興趣。關聯(lián)規(guī)則在數(shù)據(jù)挖掘領域應用廣泛,適于在大型數(shù)據(jù)中集中發(fā)現(xiàn)數(shù)據(jù)之間有意義的關系,進而對這些關聯(lián)規(guī)則進行有效評價,篩選出用戶真正感興趣的、有意義的關聯(lián)規(guī)則。

(2)分類。分類在數(shù)據(jù)挖掘中是一項非常重要的任務,其目的是學會一個分類函數(shù)或分類模型(分類器),該模型能將數(shù)據(jù)庫中的數(shù)據(jù)項映射到給定類別中的某一個類別。分類可用于預測,預測的目的是利用歷史數(shù)據(jù)記錄自動推導出對給定數(shù)據(jù)的推廣描述,從而對未來數(shù)據(jù)進行預測。

(3)時間序列挖掘和序列挖掘。時間序列挖掘是數(shù)據(jù)挖掘中的一個重要研究分支,有著廣泛的應用價值。它是指從大量的時間序列數(shù)據(jù)中提取人們事先不知道的,但又潛在有用的、與時間屬性相關的信息和知識,并用于短期、中期或長期預測,指導人們的社會、經(jīng)濟、軍事和生活等行為。序列挖掘又稱序列模式挖掘,是指從序列中發(fā)現(xiàn)相對時間或者其它順序所出現(xiàn)的高頻率子序列。作為一般性的方法和技術,序列挖掘最早由AGRAWAL等人提出,已經(jīng)成為數(shù)據(jù)挖掘新的研究分支而被廣泛討論。

(4)聚類。聚類就是將數(shù)據(jù)對象分組成多個類或簇,劃分的原則是在同一個簇中的對象之間具有較高的相似度,而不同簇中的對象差別較大。與分類不同的是,聚類操作中要劃分的類是事先未知的,類的形成完全是數(shù)據(jù)驅動的,屬于一種無指導的學習方法。

(5)Web挖掘。Web挖掘可簡單地定義為針對包括Web頁面內容、頁面之間的結構、用戶訪問信息、電子商務信息等在內的各種Web數(shù)據(jù),應用數(shù)據(jù)挖掘方法以幫助人們從WWW中提取知識,為訪問者、站點經(jīng)營者以及包括電子商務在內的基于因特網(wǎng)的商務活動提供決策支持。

(6)空間挖掘??臻g挖掘是近年來才發(fā)展起來的具有廣泛應用前景的數(shù)據(jù)挖掘技術,實質上是數(shù)據(jù)挖掘在空間數(shù)據(jù)庫或空間數(shù)據(jù)上的應用。簡言之,空間挖掘就是從空間數(shù)據(jù)庫中抽取隱含的知識、空間關系或非顯示地存儲在空間數(shù)據(jù)庫中的其它模式,用于理解空間數(shù)據(jù)、發(fā)現(xiàn)數(shù)據(jù)間(空間或非空間)的關系。

3數(shù)據(jù)挖掘技術在電力營銷系統(tǒng)中的應用

3.1關聯(lián)規(guī)則在電力營銷系統(tǒng)中的應用

關聯(lián)規(guī)則是目前電力營銷數(shù)據(jù)挖掘研究的主要技術之一,它幫助決策者分析歷史數(shù)據(jù)和當前數(shù)據(jù)的特征和規(guī)律,從而預測未來。侯雪波等[5]將關聯(lián)規(guī)則引入電力市場的營銷分析中,利用FP-Growth算法對經(jīng)過離散化處理的電力營銷數(shù)據(jù)進行關聯(lián)規(guī)則分析,描述出各種影響電量銷售的外部因素與售電量水平之間的關聯(lián)特征,為電力市場營銷提供輔助的決策信息。參考文獻[6]提出關聯(lián)規(guī)則可指導電力市場營銷策略、項目和投資組合管理,進而進行需求預測、銷售及收入預測、理賠分析等。在采用關聯(lián)規(guī)則與其它方法相結合的方向上,很多學者相繼做了深入研究。張珂等[7]提出了基于云模型和關聯(lián)分析法的電力營銷目標市場模糊評價方法,為確定電力營銷目標市場提供了一種簡單可行的方法。沈海湄等[8]提出了一種采用模糊關聯(lián)規(guī)則挖掘的電力負荷預測新方法,為電力負荷的非定性、定量分析提供了一種顯性、易于理解的方式。牛東曉等[9]也在電力負荷預測的研究上做出了努力,使總體預測精度得到提高。肖俊等[10]采用FP-Growth算法挖掘負荷數(shù)據(jù),并結合電力行業(yè)數(shù)據(jù)的特殊性,分析各相關因素對電力負荷的影響,成功地將關聯(lián)規(guī)則數(shù)據(jù)挖掘方法應用于城市負荷分析中。

3.2分類在電力營銷系統(tǒng)中的應用

在中長期預測中,除傳統(tǒng)的序列預測方法外,模糊理論[11]、專家系統(tǒng)[12]等方法均被應用。姚李孝等[13]提出的基于競爭分類的神經(jīng)網(wǎng)絡方法取得了較滿意的預測精度。馮麗等[14]提出的模式分類法可提高電力負荷預測的精確度。參考文獻[15]提出了一種將決策樹技術同外推算法相結合的短期負荷預測算法,并運用于福建省日調度計劃的編制中,預測精度較高。管勝利[16]利用分類樹形成子數(shù)據(jù)庫的方法,在進行SCADA系統(tǒng)不良數(shù)據(jù)狀態(tài)估計時,降低了SCADA數(shù)據(jù)庫的規(guī)模,有效提高了計算速度。除上述應用方向外,神經(jīng)網(wǎng)絡和模糊邏輯控制相結合的技術還在客戶關系管理(CRM)方面得到應用,參考文獻[17]對此進行了探討。參考文獻[18]利用回歸算法、神經(jīng)網(wǎng)絡以及歸納算法等多種算法得出對于各機組的開停機計劃表。

3.3時間序列挖掘和序列挖掘在電力營銷系統(tǒng)中的應用

時間序列挖掘被認為是最經(jīng)典、最系統(tǒng)、被廣泛采用的一類短期負荷預測方法。而在短期負荷預測中,應用最廣泛、研究最多的是神經(jīng)網(wǎng)絡。在實際應用中,常常將時間序列挖掘和神經(jīng)網(wǎng)絡結合來分析電力營銷數(shù)據(jù)。參考文獻[19]對此做出了很好的總結。小波神經(jīng)元網(wǎng)絡具有比BP神經(jīng)網(wǎng)絡更快的收斂速度,其改進隸屬度聚類方法的應用可改善負荷大波動日的預測精度[20]。范習輝等[21]提出了一種基于時間窗的序列挖掘算法,并將其應用于警報信息的智能處理,從而更加有效地指導電力系統(tǒng)的故障定位與診斷。參考文獻[22]提出了一種基于錯誤模型分析和快速診斷推理的新型數(shù)據(jù)挖掘算法,該算法可大大提高系統(tǒng)狀態(tài)分析和挖掘的能力,從而有效判定電力系統(tǒng)運行狀態(tài),提高對錯誤模型分析的精確度。

3.4聚類在電力營銷系統(tǒng)中的應用

聚類集中應用在電力用戶分類與信用評價、不良數(shù)據(jù)的修正、負荷預測及分類、變壓器故障診斷等方面。馮璐等[23]根據(jù)供電企業(yè)客戶各方面不同的屬性,采用聚類分析法將各客戶聚類為不同的組別,決策分析者可根據(jù)聚類的結果分析各組別之間的差異性,通過對類群特征的研究,采取差異的營銷策略,從而提高企業(yè)的經(jīng)濟效益。參考文獻[24]針對電力客戶信用分類的特征,提出基于模糊聚類分析的電力客戶信用評價算法,得到了不同客戶群的聚類中心以及客戶的隸屬度矩陣,為客戶群的特征分析提供了量化依據(jù)。參考文獻[25]在傳統(tǒng)聚類算法CURE的基礎上提出應用信息熵原則選擇聚類過程中的基本參數(shù),并利用Kohonen網(wǎng)絡提取相關負荷的特征曲線,并將其用于不良數(shù)據(jù)的校正。王志勇等[26]針對獲得的客戶用電數(shù)據(jù),在經(jīng)過一定的預處理后選取最合適的聚類方法以及聚類數(shù)目得到典型負荷代表曲線,進而了解客戶的用電模式、制訂相應的購電合同,對于增加電力部門的經(jīng)濟效益有著重要的作用。參考文獻[27]提出采用自適應矢量量化(AVQ)神經(jīng)網(wǎng)絡模糊聚類方法對電力負荷特性進行分類與綜合,因AVQ神經(jīng)網(wǎng)絡模糊聚類算法本身機時小、處理速度更快,因而結果更為合理。參考文獻[28]主要論述了利用可適應性的決策樹來對不同類型的負荷進行聚類。符楊等[29]針對模糊C均值聚類算法用于溶解氣體成分分析時存在的問題,將加權模糊核聚類方法(WFKC)引入到電力變壓器故障診斷中,建立一個新的變壓器故障診斷模型,該模型能有效改善復雜數(shù)據(jù)集的聚類性能,提高了故障診斷的正確率。鄭蕊蕊等[30]、陳舵等[31]也在電力變壓器的故障診斷方面進行了研究,取得了可喜的研究成果。

3.5空間挖掘在電力營銷系統(tǒng)中的應用

對電力營銷系統(tǒng)而言,大多數(shù)情況都需要決策人員快速地分析、診斷,并及時做出正確反應,特別是在電力市場條件下,重要決策的正確性對于電力企業(yè)的發(fā)展意義是不可估量的。將電網(wǎng)運行數(shù)據(jù)、負荷位置分布數(shù)據(jù)和實時變化數(shù)據(jù)等多目標層次的信息合為一體,利用特殊的空間技術對其進行綜合處理,才能實現(xiàn)如設備跟蹤、故障定位、模擬停電、損失評價及最優(yōu)調度等高級功能[32]。參考文獻[33]利用空間分布規(guī)則、空間聚類規(guī)則、空間特征規(guī)則、空間區(qū)分規(guī)則得到同類及不同類負荷的分布。參考文獻[34]指出空間挖掘可以應用于空間負荷預測、設備跟蹤維護和故障定位。參考文獻[35]提出可以利用空間挖掘到的普遍幾何知識(如地理編碼)對各類用戶進行業(yè)擴報裝、查表收費、負荷管理等業(yè)務營運工作,還可以根據(jù)變壓器、線路的實際負荷以及用戶的地理位置、負荷可控情況制定各種負荷控制方案,以實現(xiàn)對負荷調峰、錯峰和填谷等負荷側管理功能。

4結語

數(shù)據(jù)挖掘在電力營銷系統(tǒng)的整體應用上仍處在起步階段,單一的挖掘算法很難滿足實際決策的需要,應在多方面因素的影響下不斷改進挖掘算法。目前尚未出現(xiàn)針對特定決策支持系統(tǒng)的專門挖掘軟件,只是架構出系統(tǒng)結構,核心的算法體制并未完善,不能滿足決策需要,如何保證數(shù)據(jù)挖掘方法更精確、高效、穩(wěn)定地應用于營銷系統(tǒng)中仍是亟待解決的問題。雖然存在不足,但數(shù)據(jù)挖掘對潛在問題和規(guī)律具有很高的預見性,并且具有高效計算、監(jiān)測和管理的能力,因此,它適用于電力營銷系統(tǒng)大規(guī)模非線性問題的求解,必會顯示出其強大的生命力,成為電力營銷領域發(fā)展的重要工具。