基于大數(shù)據(jù)的網(wǎng)絡(luò)異常行為建模方法
值,認(rèn)為不相似度大于這一閾值的離群點(diǎn)為異常。
2)選擇固定數(shù)量的離群點(diǎn),即按照不相似度排序從大到小固定選擇前N個離群點(diǎn)認(rèn)為是異常。
3)選擇不相似度量值發(fā)生突變的點(diǎn),即觀察經(jīng)排序后的離群點(diǎn)的不相似度變化曲線,找出變化率有顯著變化的點(diǎn)作為判定異常的閾值。
4)人工檢查各個離群點(diǎn),根據(jù)管理分析人員的經(jīng)驗(yàn)來判定是否異常。
上述方法適用不同場景,前2種方法適用于變化不大的網(wǎng)絡(luò)環(huán)境,第3種方法能根據(jù)場景有一定的動態(tài)自適應(yīng)性,第4種方法則是在前3種方法表現(xiàn)不佳的情況下引入管理分析人員的專業(yè)知識和經(jīng)驗(yàn)作為異常檢測判定的依據(jù)。
2.2 自主的網(wǎng)絡(luò)行為建模與異常檢測
2.2.1 通過聚類建立初始的檢測模型
首先應(yīng)用子空間聚類算法的思想,從m維特征中選取k維形成子空間以供進(jìn)一步分析,若要完全探索特征空間,所要分析的子空間總數(shù)為從m個不同元素中取出k個元素的組合數(shù)。在每個子空間內(nèi)將應(yīng)用基于密度的聚類算法,如DBSCAN、OPTICS等對數(shù)據(jù)集進(jìn)行分簇。
以DBSCAN為例,它是一種能夠有效發(fā)現(xiàn)識別任意形狀和大小的簇的聚類算法,并且能標(biāo)注出游離于各分簇之外的離群點(diǎn),適合于無監(jiān)督的網(wǎng)絡(luò)流量分析場景,且無需事先指定分簇的數(shù)量。
對于每個子空間應(yīng)用如DBSCAN的基于密度的聚類算法后均可得到一組分簇結(jié)果和離群點(diǎn)集。為了選取合理的k值,即子空間維度的大小,利用聚類的一個單調(diào)性質(zhì),稱為向下封閉屬性(downward closure property),這個性質(zhì)直接說明了如果一個空間中存在有關(guān)于數(shù)據(jù)點(diǎn)密度的某項(xiàng)證據(jù),那么它一定會存在于這一空間的最低維子空間中。本文推薦使用k = 2,也就是會產(chǎn)生N = m(m-1)/2個子空間,分別應(yīng)用基于密度的聚類算法處理得到N個分簇結(jié)果和相應(yīng)的離群點(diǎn)集合。然后,使用證據(jù)積累聚類技術(shù)來對這些結(jié)果進(jìn)行融合,形成統(tǒng)一的離群點(diǎn)排序。具體來說,對于任何子空間中的一個離群點(diǎn),計(jì)算它與該子空間中最大簇中心的距離并將其累計(jì)到不相似度向量的相應(yīng)的維度。這一計(jì)算方法的思想是明確突出那些在不同子空間中與正常網(wǎng)絡(luò)流量相差較遠(yuǎn)的流(用與最大簇中心的距離來表示)。這里距離的計(jì)算使用馬式距離(Mahalanobis distance),在樣本方差較小時更能突出離群點(diǎn)的不相似度。得出不相似度向量后,將其每一維的取值進(jìn)行排序就得到所有離群點(diǎn)的不相似度排序。
2.2.2 在高速海量數(shù)據(jù)流環(huán)境中檢測異常并實(shí)時更新檢測模型
本文在數(shù)據(jù)收集過程中采用的基于時間序列的變化檢測技術(shù)具有自適應(yīng)的特性,與大數(shù)據(jù)處理和流處理技術(shù)相配合,能夠很好地適應(yīng)高速海量數(shù)據(jù)流環(huán)境。其中,在基于時間序列的變化檢測中可以采用連續(xù)滑動的時間窗口,從而達(dá)到在線實(shí)時檢測的效果,能夠更及時地發(fā)現(xiàn)新產(chǎn)生的異常。每發(fā)現(xiàn)一個存在異常的時間窗口,就會觸發(fā)后續(xù)的聚類分析及異常檢測處理過程,可以看作是網(wǎng)絡(luò)行為模型隨時間窗口行進(jìn)的不斷動態(tài)更新。
3 結(jié)語
大數(shù)據(jù)處理技術(shù)及流處理技術(shù)的飛速發(fā)展,產(chǎn)生了諸多優(yōu)秀的聚類算法。這些聚類算法能夠保證初始檢測模型構(gòu)建的高效性和合理性,且聚類算法屬于無監(jiān)督學(xué)習(xí),確保了檢測機(jī)制的普適性。本文提出了基于大數(shù)據(jù)的網(wǎng)絡(luò)異常行為建模,通過聚類算法識別偏離正常的流量,并對偏離流量的異常程度排序,采用基于閾值的方法將異常度高的流量標(biāo)記為網(wǎng)絡(luò)異常行為,其實(shí)現(xiàn)步驟和總體框架流程均參考借鑒了已有的研究成果,其可行性也有相應(yīng)的技術(shù)支持。

責(zé)任編輯:售電衡衡
- 相關(guān)閱讀
- 泛在電力物聯(lián)網(wǎng)
- 電動汽車
- 儲能技術(shù)
- 智能電網(wǎng)
- 電力通信
- 電力軟件
- 高壓技術(shù)
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計(jì)落地:鼓勵“光儲充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計(jì) -
中國自主研制的“人造太陽”重力支撐設(shè)備正式啟運(yùn)
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng)
-
新基建助推 數(shù)據(jù)中心建設(shè)將迎爆發(fā)期
2020-06-16數(shù)據(jù)中心,能源互聯(lián)網(wǎng),電力新基建 -
泛在電力物聯(lián)網(wǎng)建設(shè)下看電網(wǎng)企業(yè)數(shù)據(jù)變現(xiàn)之路
2019-11-12泛在電力物聯(lián)網(wǎng) -
泛在電力物聯(lián)網(wǎng)建設(shè)典型實(shí)踐案例
2019-10-15泛在電力物聯(lián)網(wǎng)案例
-
新基建之充電樁“火”了 想進(jìn)這個行業(yè)要“心里有底”
2020-06-16充電樁,充電基礎(chǔ)設(shè)施,電力新基建 -
燃料電池汽車駛?cè)雽こ0傩占疫€要多久?
-
備戰(zhàn)全面電動化 多部委及央企“定調(diào)”充電樁配套節(jié)奏
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計(jì)落地:鼓勵“光儲充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計(jì) -
中國自主研制的“人造太陽”重力支撐設(shè)備正式啟運(yùn)
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業(yè)發(fā)展
-
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng) -
5G新基建助力智能電網(wǎng)發(fā)展
2020-06-125G,智能電網(wǎng),配電網(wǎng) -
從智能電網(wǎng)到智能城市