www涩-www黄网站-www黄色-www黄色com-国产免费拍拍视频在线观看网站-国产免费怕怕免费视频观看

基于協(xié)同過濾算法的電能替代潛力用戶挖掘模型研究

2018-03-21 13:03:35 電力信息與通信技術(shù)  點(diǎn)擊量: 評論 (0)
電能等清潔能源的利用有助于推進(jìn)節(jié)能減排工作,優(yōu)化企業(yè)用能結(jié)構(gòu),提升能源利用效率。試圖挖掘提煉客戶采集點(diǎn)負(fù)荷數(shù)據(jù),按不同行業(yè)的能源結(jié)構(gòu)、設(shè)備類型信息分別分析其負(fù)荷特征,并通過K-means算法對已完成電能替代改造的用戶進(jìn)行聚類,運(yùn)用協(xié)同過濾算法構(gòu)建電能替代潛力用戶識別模型,

0 引言

2013年以來,我國先后發(fā)布了《國務(wù)院關(guān)于印發(fā)大氣污染防治行動計劃的通知》(國發(fā)[2013]37號)和《能源發(fā)展戰(zhàn)略行動計劃(2014—2020年)》(國辦發(fā)[2014]31號)等文件,國家層面對大氣污染的防治越來越重視。根據(jù)《關(guān)于推進(jìn)電能替代的指導(dǎo)意見》(發(fā)改能源[2016]1054號)文件,目前大氣污染的主要根源在于需求側(cè)大量的散燒煤與燃油消費(fèi)[1],這將造成嚴(yán)重的霧霾。

近十幾年來,隨著科技與技術(shù)的進(jìn)步,生產(chǎn)機(jī)器設(shè)備不斷更新?lián)Q代,企業(yè)生產(chǎn)和供電越來越緊密,國網(wǎng)浙江省電力有限公司在經(jīng)營服務(wù)中積累了海量的企業(yè)用能數(shù)據(jù),為挖掘企業(yè)電能替代前后的用能數(shù)據(jù)提供了可能[2]

另一方面,目前供電企業(yè)在推進(jìn)電能替代工作時,采用傳統(tǒng)的逐戶排查方式,排查效率低下,實(shí)際工作成功率低;而電能替代涉及的設(shè)備改造、成本核算、政策調(diào)整等問題,對工作人員的專業(yè)能力提出了更高要求[3-4]。企業(yè)需要探索新方法、研究新技術(shù),深入分析電能替代企業(yè)的特征,利用大數(shù)據(jù)技術(shù)精準(zhǔn)定位潛力用戶群體,提升企業(yè)開展電能替代工作的效率和專業(yè)化水平[5]

電能替代潛力企業(yè)分析以用能設(shè)備為切入點(diǎn),分析高能耗且使用非電能源較多的設(shè)備所處行業(yè),定位電能替代工作重點(diǎn)挖掘的行業(yè),通過分析設(shè)備能耗、生產(chǎn)時段、用電功率等信息尋找企業(yè)電能替代改造前后的用電差異,確定模型輸入指標(biāo),以此為依據(jù)構(gòu)建模型[6]

 1 電能替代研究現(xiàn)狀

國內(nèi)外學(xué)者已對電能替代做了大量研究。趙會茹等[7]從國家宏觀層面闡述了電能替代在當(dāng)前國家經(jīng)濟(jì)、環(huán)境發(fā)展戰(zhàn)略中的機(jī)遇與挑戰(zhàn),并進(jìn)行了環(huán)境和經(jīng)濟(jì)效益的量化評估;Diyar,Mehmet等[8]從能源供給側(cè)出發(fā),系統(tǒng)地分析了土耳其從以煤電為主向水電、核電、風(fēng)電等清潔能源轉(zhuǎn)變的可能性、可執(zhí)行性,同時運(yùn)用灰度算法預(yù)測電能替代的經(jīng)濟(jì)效益。此外,在對用戶用電負(fù)荷特性進(jìn)行分類研究的基礎(chǔ)上,李美娜等[9]提出了模糊C-均值聚類算法,并通過基于聚類方法評價指標(biāo),選取合適的聚類數(shù)目。

本文在用戶分類上采用了K-means均值分類算法,在確定聚類數(shù)目時綜合考慮可替代設(shè)備、行業(yè)的生產(chǎn)特性因素。在對企業(yè)電能替代潛力預(yù)測方面,本文從電能需求側(cè)供給角度出發(fā),采用大數(shù)據(jù)挖掘技術(shù),運(yùn)用有監(jiān)督的協(xié)同過濾學(xué)習(xí)算法,實(shí)現(xiàn)對電能替代潛力用戶的判別[10-11],提升供電企業(yè)電能替代工作的專業(yè)化和信息化水平。

 2 重點(diǎn)行業(yè)分析及行業(yè)聚類

2.1 重點(diǎn)行業(yè)分析

根據(jù)《國民經(jīng)濟(jì)行業(yè)分類》(GB/T4754—2002),我國行業(yè)共分20個門類913個小類,不同行業(yè)的產(chǎn)品、生產(chǎn)時段、生產(chǎn)設(shè)備等都存在較大差異,假如對所有細(xì)分行業(yè)分門別類地分析建模,不僅耗時耗力,且很可能會存在因部分行業(yè)目標(biāo)樣本過少導(dǎo)致模型結(jié)果不顯著的問題[12]

本文基于細(xì)分行業(yè)各類能源使用的占比、可替代設(shè)備集中行業(yè)兩方面對細(xì)分行業(yè)進(jìn)行篩選,根據(jù)浙江省能源結(jié)構(gòu)[1],對能耗較高、非電能源占比較高且具備可替代設(shè)備的行業(yè)進(jìn)行重點(diǎn)分析。

2014年工業(yè)各行業(yè)能源消費(fèi)總量及構(gòu)成如圖1所示,從能源結(jié)構(gòu)角度看,非金屬礦物、化學(xué)制品、金屬冶煉行業(yè)、采掘、燃料加工5個行業(yè)非電能源使用比重較高且能耗較大[13]

圖1 2014年工業(yè)各行業(yè)能源消費(fèi)總量及構(gòu)成Fig.1 Total energy consumption and composition of industrial sectors in 2014

從可替代設(shè)備所應(yīng)用的行業(yè)角度看,根據(jù)《關(guān)于推進(jìn)電能替代的指導(dǎo)意見》,當(dāng)前主要可替代設(shè)備有窯爐、鍋爐、采暖等,各類替代設(shè)備主要應(yīng)用行業(yè)見表1所列。

結(jié)合上述分析,并將部分生產(chǎn)特征相似的行業(yè)歸納合并,初步確定20個待分析行業(yè),電能替代重點(diǎn)行業(yè)見表2所列。

表1 各類替代設(shè)備主要應(yīng)用行業(yè)Tab.1 Major application industries of alternative equipments

表2 電能替代重點(diǎn)行業(yè)Tab.2 Key industries of power substitution

2.2 行業(yè)聚類分析及類別選擇

對各行業(yè)分時用電負(fù)荷進(jìn)行統(tǒng)計描述分析,各行業(yè)96點(diǎn)日負(fù)荷曲線分布如圖2所示,可以看出部分行業(yè)負(fù)荷曲線呈現(xiàn)較高的相似性,如金融、房地產(chǎn)、商務(wù)及居民服務(wù)業(yè)和商業(yè)、住宿、餐飲業(yè),非金屬礦物制品業(yè)與金屬鑄造業(yè)。

對各行業(yè)96點(diǎn)負(fù)荷變量采用K-means算法進(jìn)行聚類分析,各行業(yè)聚類結(jié)果見表3所列,19個行業(yè)根據(jù)其用電負(fù)荷特征整合成8類。由表3可以看到,聚類結(jié)果中同分類的行業(yè)存在明顯的相關(guān)關(guān)系。其中1類主要為農(nóng)業(yè)、服務(wù)行業(yè),2、3、4、6、7類是偏生產(chǎn)類行業(yè),5、8類是偏商業(yè)、辦公類行業(yè)。

圖2 各行業(yè)96點(diǎn)日負(fù)荷曲線分布Fig.2 Distribution curves of load curves with 96 points per day in different industries

表3 各行業(yè)聚類結(jié)果Tab.3 Results of cluster analysis in different industries

另一方面,通過數(shù)據(jù)統(tǒng)計,部分類群對應(yīng)的已完成電能替代改造的樣本數(shù)過少,以此構(gòu)建的模型解釋能力一般較弱(見表4)。根據(jù)建模的原則,輸入模型的樣本數(shù)至少為變量數(shù)的2~3倍,本模型分析的變量為96點(diǎn)負(fù)荷數(shù)據(jù),各分類的樣本數(shù)應(yīng)滿足至少達(dá)到192個,表4中僅有分類2、3、5、8滿足此條件。因此,本文僅考慮對這4類用戶進(jìn)行建模分析。

表4 各類群已改造樣本數(shù)Tab.4 The number of transformed samples in each group

 3 企業(yè)電能替代前后用電特征變化研究

企業(yè)用電的用途主要分3類:日常照明、機(jī)械設(shè)備運(yùn)作和供能加熱。在電能替代中,以供能加熱設(shè)備為例,如窯爐替換成中頻爐、燃煤鍋爐替換成電鍋爐,天然氣供熱替換成電供熱等,這類加熱設(shè)備普遍存在功率大、能耗高等特點(diǎn),此類設(shè)備耗電量一般占企業(yè)總用電量的30%~60%,用電時段呈現(xiàn)出階段性特征。這種階段性高耗電的特征在企業(yè)用電負(fù)荷數(shù)據(jù)上會出現(xiàn)明顯的波峰,因此通過比對用電負(fù)荷的差異,能夠精準(zhǔn)地識別出使用非電能源的企業(yè)[14]

本文選取了金屬鑄造(五金、電器鑄造業(yè))和公共事業(yè)(高等院校)兩個典型行業(yè)進(jìn)行電能替代改造前后的日負(fù)荷曲線分析[15]。改造前后負(fù)荷曲線變化如圖3所示。其中五金、電器等金屬鑄造業(yè)在實(shí)施中頻爐替代窯爐改造后,在2:00-6:00時的負(fù)荷曲線遠(yuǎn)高于改造前,這是因為金屬鑄造業(yè)使用窯爐(中頻爐)的時間多在凌晨,因此在該時段內(nèi)出現(xiàn)高峰負(fù)荷;高等院校食堂炊具在實(shí)施煤氣改電后,明顯在5:00、10:00時出現(xiàn)兩波負(fù)荷高峰,這主要是因為該時間段分別為學(xué)校早餐、中餐時段。

通過大量樣本觀測發(fā)現(xiàn),不同行業(yè)替代設(shè)備改造前后的日負(fù)荷曲線變化差異較大,而在同行業(yè)中這種差異十分顯著,這為通過對比目標(biāo)樣本改造前的日負(fù)荷曲線與待預(yù)測樣本的日負(fù)荷曲線的相似度提供了可能。

圖3 典型行業(yè)電能替代改造前后日負(fù)荷曲線變化Fig.3 Daily load curve changes before and after replacement of electric energy in typical industries

 4 基于協(xié)同過濾算法的電能替代用戶判別模型

4.1 算法選擇

目前對曲線相似度的計算主要是運(yùn)用動態(tài)時間歸整(Dynamic Time Warping,DTW)算法,但該算法需要大量的路徑并對這些路徑節(jié)點(diǎn)進(jìn)行匹配計算,而日負(fù)荷96點(diǎn)曲線的節(jié)點(diǎn)數(shù)量過少,容易造成計算結(jié)果識別率不高的問題,基于DTW算法的公共事業(yè)行業(yè)的各類日負(fù)荷曲線如圖4所示,運(yùn)用DTW算法的同一類別曲線間差異較大,使用效果并
不佳。

圖4 基于DTW算法的公共事業(yè)行業(yè)的各類日負(fù)荷曲線Fig.4 Daily load curve of public utilities industry based on DTW algorithm

本文通過處理96點(diǎn)日負(fù)荷,計算2個企業(yè)間的相似度。通過將目標(biāo)樣本改造前曲線與待預(yù)測樣本曲線的相似度對比,找出各類群與目標(biāo)樣本改造前曲線相似的企業(yè),作為模型結(jié)果潛力用戶的輸出。模型思路如圖5所示。

圖5 模型思路Fig.5 Thinking of model

協(xié)同過濾算法在電商領(lǐng)域有著廣泛的應(yīng)用,它是一種商品推薦算法,用于給品味相似的用戶推薦相關(guān)的商品。

在本文中,將商品替換為96點(diǎn)日負(fù)荷采集點(diǎn),采用皮爾遜相關(guān)系數(shù)[10]計算兩個用戶間的相似度。假設(shè)用戶A在負(fù)荷點(diǎn)i的得分為ra,i,用戶A所有負(fù)荷點(diǎn)平均得分為ra,用戶A的負(fù)荷點(diǎn)得分集合為Ia,用戶A和用戶B負(fù)荷點(diǎn)得分集合為Iab,則用戶A、B的Pearson相似度為:

 

式中,μ為每個簇S的平均值,上式等同于最小化成對的平方偏差:

Tab.5 Sample distribution and stratified sampling results of various groups " style="box-sizing: border-box; color: rgb(43, 43, 43); text-decoration-line: none;">表5 各類群樣本分布及分層抽樣結(jié)果Tab.5 Sample distribution and stratified sampling results of various groups

協(xié)同過濾算法屬于關(guān)聯(lián)算法,因此在模型驗證上沿用傳統(tǒng)模型驗證的思維,即檢驗?zāi)繕?biāo)樣本對待預(yù)測樣本識別的準(zhǔn)確性和穩(wěn)定性[16],用測試集與驗證集內(nèi)的目標(biāo)樣本分別計算待預(yù)測樣本的相
似度。

至此,對協(xié)同過濾算法的驗證問題將轉(zhuǎn)化為兩獨(dú)立樣本的差異性檢驗問題,T檢驗結(jié)果P值為0.20,遠(yuǎn)大于0.05,接受原假設(shè),說明通過測試集與驗證集得到的結(jié)果并無太大差異。

在此,引入其他預(yù)測模型算法,并對比在此項目中與協(xié)同過濾算法的優(yōu)劣。各模型算法成效比較(以Cluster3為例)見表6和圖6,協(xié)同過濾算法在訓(xùn)練集和驗證集上整體表現(xiàn)都比較穩(wěn)定,準(zhǔn)確率高達(dá)96.23%。而DTW算法對負(fù)荷曲線的識別能力相對較差,準(zhǔn)確率僅為86.17%。決策樹與邏輯回歸算法雖然在訓(xùn)練集上表現(xiàn)較佳,但由于輸入變量過多,很明顯地出現(xiàn)了過擬合現(xiàn)象,驗證集準(zhǔn)確率遠(yuǎn)低于訓(xùn)練集準(zhǔn)確率。

大云網(wǎng)官方微信售電那點(diǎn)事兒

責(zé)任編輯:售電衡衡

免責(zé)聲明:本文僅代表作者個人觀點(diǎn),與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。
我要收藏
個贊
?
主站蜘蛛池模板: 美国一级大黄香蕉片 | 美女大片高清特黄a大片 | 99久久精品免费观看国产 | 国产一区二区三区手机在线观看 | 三级毛片在线免费观看 | 扒开两腿猛进入爽爽视频 | 91国内精品久久久久影院优播 | 狠狠色丁香婷婷久久综合不卡 | 美女视频在线观看黄 | 在线免费观看一区二区三区 | 手机在线黄色网址 | 日日噜噜噜夜夜爽爽狠狠69 | 欧美aaa毛片免费看 欧美aaa视频 | 黄视频在线免费 | 亚洲精品国产一区二区三区四区 | 色女生影院 | 91精品人成在线观看 | 国产伦精一区二区三区视频 | 日韩精品一区二区在线观看 | 色a在线| 国产精品久久久久久久久久直 | 台湾一级特黄精品大片 | 国产精品18久久久久网站 | 国产欧美亚洲三区久在线观看 | 亚洲国产品综合人成综合网站 | 亚洲综合在线观看视频 | 国产精品高清视亚洲精品 | 97免费视频在线观看 | 日韩一区二区视频在线观看 | 亚洲伊人色 | 18免费网站| 久久久久久久99久久久毒国产 | 午夜神马理论 | 色拍拍在精品视频69影院在线 | 九九99九九在线精品视频 | 免费人成年短视频在线观看网站 | 台湾久久 | 一级性毛片 | 国产亚洲精品九九久在线观看 | 欧美日韩在线观看一区 | 国产成人精品日本亚洲网站 |