www涩-www黄网站-www黄色-www黄色com-国产免费拍拍视频在线观看网站-国产免费怕怕免费视频观看

基于協同過濾算法的電能替代潛力用戶挖掘模型研究

2018-03-21 13:03:35 電力信息與通信技術  點擊量: 評論 (0)
電能等清潔能源的利用有助于推進節能減排工作,優化企業用能結構,提升能源利用效率。試圖挖掘提煉客戶采集點負荷數據,按不同行業的能源結構、設備類型信息分別分析其負荷特征,并通過K-means算法對已完成電能替代改造的用戶進行聚類,運用協同過濾算法構建電能替代潛力用戶識別模型,

0 引言

2013年以來,我國先后發布了《國務院關于印發大氣污染防治行動計劃的通知》(國發[2013]37號)和《能源發展戰略行動計劃(2014—2020年)》(國辦發[2014]31號)等文件,國家層面對大氣污染的防治越來越重視。根據《關于推進電能替代的指導意見》(發改能源[2016]1054號)文件,目前大氣污染的主要根源在于需求側大量的散燒煤與燃油消費[1],這將造成嚴重的霧霾。

近十幾年來,隨著科技與技術的進步,生產機器設備不斷更新換代,企業生產和供電越來越緊密,國網浙江省電力有限公司在經營服務中積累了海量的企業用能數據,為挖掘企業電能替代前后的用能數據提供了可能[2]

另一方面,目前供電企業在推進電能替代工作時,采用傳統的逐戶排查方式,排查效率低下,實際工作成功率低;而電能替代涉及的設備改造、成本核算、政策調整等問題,對工作人員的專業能力提出了更高要求[3-4]。企業需要探索新方法、研究新技術,深入分析電能替代企業的特征,利用大數據技術精準定位潛力用戶群體,提升企業開展電能替代工作的效率和專業化水平[5]

電能替代潛力企業分析以用能設備為切入點,分析高能耗且使用非電能源較多的設備所處行業,定位電能替代工作重點挖掘的行業,通過分析設備能耗、生產時段、用電功率等信息尋找企業電能替代改造前后的用電差異,確定模型輸入指標,以此為依據構建模型[6]

 1 電能替代研究現狀

國內外學者已對電能替代做了大量研究。趙會茹等[7]從國家宏觀層面闡述了電能替代在當前國家經濟、環境發展戰略中的機遇與挑戰,并進行了環境和經濟效益的量化評估;Diyar,Mehmet等[8]從能源供給側出發,系統地分析了土耳其從以煤電為主向水電、核電、風電等清潔能源轉變的可能性、可執行性,同時運用灰度算法預測電能替代的經濟效益。此外,在對用戶用電負荷特性進行分類研究的基礎上,李美娜等[9]提出了模糊C-均值聚類算法,并通過基于聚類方法評價指標,選取合適的聚類數目。

本文在用戶分類上采用了K-means均值分類算法,在確定聚類數目時綜合考慮可替代設備、行業的生產特性因素。在對企業電能替代潛力預測方面,本文從電能需求側供給角度出發,采用大數據挖掘技術,運用有監督的協同過濾學習算法,實現對電能替代潛力用戶的判別[10-11],提升供電企業電能替代工作的專業化和信息化水平。

 2 重點行業分析及行業聚類

2.1 重點行業分析

根據《國民經濟行業分類》(GB/T4754—2002),我國行業共分20個門類913個小類,不同行業的產品、生產時段、生產設備等都存在較大差異,假如對所有細分行業分門別類地分析建模,不僅耗時耗力,且很可能會存在因部分行業目標樣本過少導致模型結果不顯著的問題[12]

本文基于細分行業各類能源使用的占比、可替代設備集中行業兩方面對細分行業進行篩選,根據浙江省能源結構[1],對能耗較高、非電能源占比較高且具備可替代設備的行業進行重點分析。

2014年工業各行業能源消費總量及構成如圖1所示,從能源結構角度看,非金屬礦物、化學制品、金屬冶煉行業、采掘、燃料加工5個行業非電能源使用比重較高且能耗較大[13]

圖1 2014年工業各行業能源消費總量及構成Fig.1 Total energy consumption and composition of industrial sectors in 2014

從可替代設備所應用的行業角度看,根據《關于推進電能替代的指導意見》,當前主要可替代設備有窯爐、鍋爐、采暖等,各類替代設備主要應用行業見表1所列。

結合上述分析,并將部分生產特征相似的行業歸納合并,初步確定20個待分析行業,電能替代重點行業見表2所列。

表1 各類替代設備主要應用行業Tab.1 Major application industries of alternative equipments

表2 電能替代重點行業Tab.2 Key industries of power substitution

2.2 行業聚類分析及類別選擇

對各行業分時用電負荷進行統計描述分析,各行業96點日負荷曲線分布如圖2所示,可以看出部分行業負荷曲線呈現較高的相似性,如金融、房地產、商務及居民服務業和商業、住宿、餐飲業,非金屬礦物制品業與金屬鑄造業。

對各行業96點負荷變量采用K-means算法進行聚類分析,各行業聚類結果見表3所列,19個行業根據其用電負荷特征整合成8類。由表3可以看到,聚類結果中同分類的行業存在明顯的相關關系。其中1類主要為農業、服務行業,2、3、4、6、7類是偏生產類行業,5、8類是偏商業、辦公類行業。

圖2 各行業96點日負荷曲線分布Fig.2 Distribution curves of load curves with 96 points per day in different industries

表3 各行業聚類結果Tab.3 Results of cluster analysis in different industries

另一方面,通過數據統計,部分類群對應的已完成電能替代改造的樣本數過少,以此構建的模型解釋能力一般較弱(見表4)。根據建模的原則,輸入模型的樣本數至少為變量數的2~3倍,本模型分析的變量為96點負荷數據,各分類的樣本數應滿足至少達到192個,表4中僅有分類2、3、5、8滿足此條件。因此,本文僅考慮對這4類用戶進行建模分析。

表4 各類群已改造樣本數Tab.4 The number of transformed samples in each group

 3 企業電能替代前后用電特征變化研究

企業用電的用途主要分3類:日常照明、機械設備運作和供能加熱。在電能替代中,以供能加熱設備為例,如窯爐替換成中頻爐、燃煤鍋爐替換成電鍋爐,天然氣供熱替換成電供熱等,這類加熱設備普遍存在功率大、能耗高等特點,此類設備耗電量一般占企業總用電量的30%~60%,用電時段呈現出階段性特征。這種階段性高耗電的特征在企業用電負荷數據上會出現明顯的波峰,因此通過比對用電負荷的差異,能夠精準地識別出使用非電能源的企業[14]

本文選取了金屬鑄造(五金、電器鑄造業)和公共事業(高等院校)兩個典型行業進行電能替代改造前后的日負荷曲線分析[15]。改造前后負荷曲線變化如圖3所示。其中五金、電器等金屬鑄造業在實施中頻爐替代窯爐改造后,在2:00-6:00時的負荷曲線遠高于改造前,這是因為金屬鑄造業使用窯爐(中頻爐)的時間多在凌晨,因此在該時段內出現高峰負荷;高等院校食堂炊具在實施煤氣改電后,明顯在5:00、10:00時出現兩波負荷高峰,這主要是因為該時間段分別為學校早餐、中餐時段。

通過大量樣本觀測發現,不同行業替代設備改造前后的日負荷曲線變化差異較大,而在同行業中這種差異十分顯著,這為通過對比目標樣本改造前的日負荷曲線與待預測樣本的日負荷曲線的相似度提供了可能。

圖3 典型行業電能替代改造前后日負荷曲線變化Fig.3 Daily load curve changes before and after replacement of electric energy in typical industries

 4 基于協同過濾算法的電能替代用戶判別模型

4.1 算法選擇

目前對曲線相似度的計算主要是運用動態時間歸整(Dynamic Time Warping,DTW)算法,但該算法需要大量的路徑并對這些路徑節點進行匹配計算,而日負荷96點曲線的節點數量過少,容易造成計算結果識別率不高的問題,基于DTW算法的公共事業行業的各類日負荷曲線如圖4所示,運用DTW算法的同一類別曲線間差異較大,使用效果并
不佳。

圖4 基于DTW算法的公共事業行業的各類日負荷曲線Fig.4 Daily load curve of public utilities industry based on DTW algorithm

本文通過處理96點日負荷,計算2個企業間的相似度。通過將目標樣本改造前曲線與待預測樣本曲線的相似度對比,找出各類群與目標樣本改造前曲線相似的企業,作為模型結果潛力用戶的輸出。模型思路如圖5所示。

圖5 模型思路Fig.5 Thinking of model

協同過濾算法在電商領域有著廣泛的應用,它是一種商品推薦算法,用于給品味相似的用戶推薦相關的商品。

在本文中,將商品替換為96點日負荷采集點,采用皮爾遜相關系數[10]計算兩個用戶間的相似度。假設用戶A在負荷點i的得分為ra,i,用戶A所有負荷點平均得分為ra,用戶A的負荷點得分集合為Ia,用戶A和用戶B負荷點得分集合為Iab,則用戶A、B的Pearson相似度為:

 

式中,μ為每個簇S的平均值,上式等同于最小化成對的平方偏差:

Tab.5 Sample distribution and stratified sampling results of various groups " style="box-sizing: border-box; color: rgb(43, 43, 43); text-decoration-line: none;">表5 各類群樣本分布及分層抽樣結果Tab.5 Sample distribution and stratified sampling results of various groups

協同過濾算法屬于關聯算法,因此在模型驗證上沿用傳統模型驗證的思維,即檢驗目標樣本對待預測樣本識別的準確性和穩定性[16],用測試集與驗證集內的目標樣本分別計算待預測樣本的相
似度。

至此,對協同過濾算法的驗證問題將轉化為兩獨立樣本的差異性檢驗問題,T檢驗結果P值為0.20,遠大于0.05,接受原假設,說明通過測試集與驗證集得到的結果并無太大差異。

在此,引入其他預測模型算法,并對比在此項目中與協同過濾算法的優劣。各模型算法成效比較(以Cluster3為例)見表6和圖6,協同過濾算法在訓練集和驗證集上整體表現都比較穩定,準確率高達96.23%。而DTW算法對負荷曲線的識別能力相對較差,準確率僅為86.17%。決策樹與邏輯回歸算法雖然在訓練集上表現較佳,但由于輸入變量過多,很明顯地出現了過擬合現象,驗證集準確率遠低于訓練集準確率。

大云網官方微信售電那點事兒

責任編輯:售電衡衡

免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
?
主站蜘蛛池模板: 亚洲六月丁香六月婷婷蜜芽| 亚洲高清在线看| 亚洲精品一区91| 黄 色 三 级 网站| 欧美午夜精品久久久久久黑人| 国产美女一级毛片| 日韩精品在线观看免费| 一区二区三区伦理| 国产欧美日本亚洲精品五区| 色视频在线观看视频| 国产免费一级片| 成人在线观看午夜| 加勒比一本一道在线| 精品99久久| 九九在线免费视频| 国内精品久久久久久| 日本高清va不卡视频在线观看| 日日操夜夜爽| 亚洲性xo| 特色毛片| 亚洲第一免费网站| 日本68xxxxxxxxx老师| 亚洲视频一区在线| 日本精品久久| 天天精品在线| 久久综合精品国产一区二区三区| 三级大片网站| 玖玖精品视频在线| 久草视屏| a级片免费观看| 日本精品高清一区二区不卡| 视频二区国产| 久久精品免费| 在线永久免费观看黄网站| 欧美整片在线| 亚洲国产一区二区三区四区五区| 亚洲成a人v大片在线观看| 国内精品久久影视| 特级aaa片毛片免费观看| 欧美高清一级片| 成人久久久久|