混合聚類分析算法在發電設備故障模式識別中的應用
0 引言
大型火電廠主、輔機數量較多,結構復雜,其作用是完成從熱能到機械能再到電能的轉換過程。設備與設備之間的耦合性、系統的復雜性等因素決定了火電廠是一個高故障率和故障危害性很大的生產場所,這些故障都將造成重大的經濟損失和社會后果,因此應用設備故障預警及狀態監測技術,掌握關鍵設備的正常運行狀態,及時發現易損部件的工況惡化趨勢,及時進行維護和檢修,對提高設備的可靠性和安全性十分必要[1-5]。
目前,發電設備預警和預知維修的關鍵技術主要有狀態監測技術、故障診斷與預測技術和維修分析與決策,而故障模式識別是這些技術的基礎。本文采用K-means算法與基于EM(期望最大)的高斯混合模型(Gaussian Mixture Model,GMM)算法相結合的聚類分析算法進行故障模式識別,實踐結果證明該算法能夠很好地用于發電設備智能診斷預測。
1 算法介紹
1.1 K-means算法
K-means算法,也被稱為K-平均或K-均值算法,是一種得到廣泛應用的聚類分析方法[6]。該算法的主要思想是:將各個聚類子集內所有數據樣本的均值作為該聚類的代表點,通過迭代的方法逐次更新各聚類中心的值,把數據集劃分為不同的類別,最終目標是使評價聚類性能準則的函數達到最優,使生成的每個聚類(簇)內緊湊,類間獨立[7-10]。
假設要把樣本集X={x1, x2, x3,…, xn}分為K個類別,算法的過程描述如下:
算法:K-means算法,劃分并計算基于簇中對象的平均值;
輸入:簇的數目
輸出:
算法步驟:
1)為每個聚類確定一個初始聚類中心,形成K個初始聚類中心;
2)將樣本集中的樣本按照最小距離原則分配到最鄰近的聚類;
3)利用每個聚類中的樣本均值作為新的聚類中心;
4)重復步驟2和步驟3,直到聚類不再變化;
5)迭代結束,得到K個聚類。
K-means算法的優點是算法快速、簡單,對大數據集有較高的效率并且是可伸縮的。缺點是需要根據初始聚類中心來確定一個初始劃分,然后對初始劃分進行優化。在K-means 算法中,多維空間相似性度量基于歐氏距離進行計算,并不能準確反映多維空間點中的相似情況。
1.2 高斯混合模型(GMM)
1.2.1 多維空間單高斯模型(SGM)
假設有一組在多維空間(假設維度為D)的點Xi,i=1,2,…,n,若這些點的分布近似橢球狀,則可以用高斯密度函數g(X,μ,Σ)來描述產生這些點的密度函數:
由于xi為己知點,可通過p(X;μ,Σ)來求解μ和Σ。這類問題通常以極大似然估計的方法來進行求解,即在p(X;μ,Σ)為最大值條件下(樣本點xi已經發生,故可認為p(X;μ,Σ)樣本xi發生的概率最大),求得μ和Σ。根據極值理論,可以通過對μ和Σ分別求導的方式求解。
1.2.2 高斯混合模型(GMM)
SGM樣本點的分布為橢球狀。而實際中,大部分樣本點分布不可能是或近似橢球狀,因此引用了高斯混合模型(GMM)。GMM是一種常用的描述混合密度函數分布的模型,可視為多個高斯分布以一定比例混合而成[11-14],GMM模型可描述為:
Fig.1 Solution program
基于K-means與GMM結合的聚類分析算法描述如下:
1)引用初始K個高斯混合模型,其初始參數為A0、Mu0、Σ0;
2)在第1次迭代中,通過最大期望算法得到A1、Mu1、Σ1;
3)將更新后的高斯模型進行第2次迭代,得到A2、Mu2、Σ2;
4)進行多次迭代后,值變化達到殘差設定值,則迭代結束,得到最終A、Mu以及Σn。
2.2 模型相似度算法詳解
在得到高斯混合模型的數學求解結果后,計算機基于EM算法不斷求解和迭代可以得到GMM各個模型的參數μ和Σ。在現場得到的實時數據將與GMM中的模型期望值進行相似度比較,相似度最高的期望值將作為實時數據的期望值。
對于2個D維數據對象X={x1, x2,…, xd}和Y={y1, y2,…, yd},相似度計算方法如下:
圖2 前置泵電機溫度訓練樣本與期望值趨勢圖Fig.2 Training sample and expected trend of front pump motor temperature
圖3 前置泵電機溫度實時數據與期望值趨勢圖Fig.3 Real - time data and expectation trend of front pump motor temperature
圖4 前置泵電機溫度相似度趨勢圖Fig.4 Similarity trend of front pump motor temperature
從實例可以得出,采用K-means(K均值)與基于EM的GMM算法相結合的聚類分析算法能夠對發電設備故障模式進行提取,并以此作為故障模式識別的依據,對于1 000個樣本的驗證結果,經檢驗后發現其與實際情況基本吻合。
4 結語
本文針對火力發電機組發電設備故障預警的難題,研究了K-means與GMM結合的聚類分析算法,應用 K-means初始化構建混合高斯模型,使用 EM 算法進行參數估測,并建立了完整的分類模型,驗證了該數據挖掘技術在故障診斷中應用的可行性,為發電設備的預警和預知維修奠定了基礎。

責任編輯:售電衡衡
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市