基于協同過濾算法的電能替代潛力用戶挖掘模型研究
0 引言
2013年以來,我國先后發布了《國務院關于印發大氣污染防治行動計劃的通知》(國發[2013]37號)和《能源發展戰略行動計劃(2014—2020年)》(國辦發[2014]31號)等文件,國家層面對大氣污染的防治越來越重視。根據《關于推進電能替代的指導意見》(發改能源[2016]1054號)文件,目前大氣污染的主要根源在于需求側大量的散燒煤與燃油消費[1],這將造成嚴重的霧霾。
近十幾年來,隨著科技與技術的進步,生產機器設備不斷更新換代,企業生產和供電越來越緊密,國網浙江省電力有限公司在經營服務中積累了海量的企業用能數據,為挖掘企業電能替代前后的用能數據提供了可能[2]。
另一方面,目前供電企業在推進電能替代工作時,采用傳統的逐戶排查方式,排查效率低下,實際工作成功率低;而電能替代涉及的設備改造、成本核算、政策調整等問題,對工作人員的專業能力提出了更高要求[3-4]。企業需要探索新方法、研究新技術,深入分析電能替代企業的特征,利用大數據技術精準定位潛力用戶群體,提升企業開展電能替代工作的效率和專業化水平[5]。
電能替代潛力企業分析以用能設備為切入點,分析高能耗且使用非電能源較多的設備所處行業,定位電能替代工作重點挖掘的行業,通過分析設備能耗、生產時段、用電功率等信息尋找企業電能替代改造前后的用電差異,確定模型輸入指標,以此為依據構建模型[6]。
1 電能替代研究現狀
國內外學者已對電能替代做了大量研究。趙會茹等[7]從國家宏觀層面闡述了電能替代在當前國家經濟、環境發展戰略中的機遇與挑戰,并進行了環境和經濟效益的量化評估;Diyar,Mehmet等[8]從能源供給側出發,系統地分析了土耳其從以煤電為主向水電、核電、風電等清潔能源轉變的可能性、可執行性,同時運用灰度算法預測電能替代的經濟效益。此外,在對用戶用電負荷特性進行分類研究的基礎上,李美娜等[9]提出了模糊C-均值聚類算法,并通過基于聚類方法評價指標,選取合適的聚類數目。
本文在用戶分類上采用了K-means均值分類算法,在確定聚類數目時綜合考慮可替代設備、行業的生產特性因素。在對企業電能替代潛力預測方面,本文從電能需求側供給角度出發,采用大數據挖掘技術,運用有監督的協同過濾學習算法,實現對電能替代潛力用戶的判別[10-11],提升供電企業電能替代工作的專業化和信息化水平。
2 重點行業分析及行業聚類
2.1 重點行業分析
根據《國民經濟行業分類》(GB/T4754—2002),我國行業共分20個門類913個小類,不同行業的產品、生產時段、生產設備等都存在較大差異,假如對所有細分行業分門別類地分析建模,不僅耗時耗力,且很可能會存在因部分行業目標樣本過少導致模型結果不顯著的問題[12]。
本文基于細分行業各類能源使用的占比、可替代設備集中行業兩方面對細分行業進行篩選,根據浙江省能源結構[1],對能耗較高、非電能源占比較高且具備可替代設備的行業進行重點分析。
2014年工業各行業能源消費總量及構成如
從可替代設備所應用的行業角度看,根據《關于推進電能替代的指導意見》,當前主要可替代設備有窯爐、鍋爐、采暖等,各類替代設備主要應用行業見
結合上述分析,并將部分生產特征相似的行業歸納合并,初步確定20個待分析行業,電能替代重點行業見
2.2 行業聚類分析及類別選擇
對各行業分時用電負荷進行統計描述分析,各行業96點日負荷曲線分布如
對各行業96點負荷變量采用K-means算法進行聚類分析,各行業聚類結果見
另一方面,通過數據統計,部分類群對應的已完成電能替代改造的樣本數過少,以此構建的模型解釋能力一般較弱(見
3 企業電能替代前后用電特征變化研究
企業用電的用途主要分3類:日常照明、機械設備運作和供能加熱。在電能替代中,以供能加熱設備為例,如窯爐替換成中頻爐、燃煤鍋爐替換成電鍋爐,天然氣供熱替換成電供熱等,這類加熱設備普遍存在功率大、能耗高等特點,此類設備耗電量一般占企業總用電量的30%~60%,用電時段呈現出階段性特征。這種階段性高耗電的特征在企業用電負荷數據上會出現明顯的波峰,因此通過比對用電負荷的差異,能夠精準地識別出使用非電能源的企業[14]。
本文選取了金屬鑄造(五金、電器鑄造業)和公共事業(高等院校)兩個典型行業進行電能替代改造前后的日負荷曲線分析[15]。改造前后負荷曲線變化如
通過大量樣本觀測發現,不同行業替代設備改造前后的日負荷曲線變化差異較大,而在同行業中這種差異十分顯著,這為通過對比目標樣本改造前的日負荷曲線與待預測樣本的日負荷曲線的相似度提供了可能。
4 基于協同過濾算法的電能替代用戶判別模型
4.1 算法選擇
目前對曲線相似度的計算主要是運用動態時間歸整(Dynamic Time Warping,DTW)算法,但該算法需要大量的路徑并對這些路徑節點進行匹配計算,而日負荷96點曲線的節點數量過少,容易造成計算結果識別率不高的問題,基于DTW算法的公共事業行業的各類日負荷曲線如
不佳。
本文通過處理96點日負荷,計算2個企業間的相似度。通過將目標樣本改造前曲線與待預測樣本曲線的相似度對比,找出各類群與目標樣本改造前曲線相似的企業,作為模型結果潛力用戶的輸出。模型思路如
協同過濾算法在電商領域有著廣泛的應用,它是一種商品推薦算法,用于給品味相似的用戶推薦相關的商品。
在本文中,將商品替換為96點日負荷采集點,采用皮爾遜相關系數[10]計算兩個用戶間的相似度。假設用戶A在負荷點i的得分為ra,i,用戶A所有負荷點平均得分為ra,用戶A的負荷點得分集合為Ia,用戶A和用戶B負荷點得分集合為Iab,則用戶A、B的Pearson相似度為:
式中,μ為每個簇S的平均值,上式等同于最小化成對的平方偏差:
協同過濾算法屬于關聯算法,因此在模型驗證上沿用傳統模型驗證的思維,即檢驗目標樣本對待預測樣本識別的準確性和穩定性[16],用測試集與驗證集內的目標樣本分別計算待預測樣本的相
似度。
至此,對協同過濾算法的驗證問題將轉化為兩獨立樣本的差異性檢驗問題,T檢驗結果P值為0.20,遠大于0.05,接受原假設,說明通過測試集與驗證集得到的結果并無太大差異。
在此,引入其他預測模型算法,并對比在此項目中與協同過濾算法的優劣。各模型算法成效比較(以Cluster3為例)見
責任編輯:售電衡衡
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市