基于實(shí)時(shí)關(guān)聯(lián)分析算法及CEP的大數(shù)據(jù)安全分析模塊研究與實(shí)現(xiàn)
足“當(dāng)郵件賬號(hào)2次登錄的IP位置距離大于2次登錄時(shí)間內(nèi)飛機(jī)的最大飛行距離時(shí),該賬號(hào)即為異常賬號(hào)”的場(chǎng)景分析規(guī)則即為異常登錄行為。對(duì)符合該類(lèi)場(chǎng)景規(guī)則的數(shù)據(jù)關(guān)聯(lián)分析最終生成告警,并由相關(guān)人員進(jìn)行不同處置。
首先通過(guò)數(shù)據(jù)采集層獲取的主機(jī)類(lèi)日志,識(shí)別郵件登錄日志,對(duì)郵件登錄日志進(jìn)行去重去噪分析及語(yǔ)義分析,由于生產(chǎn)環(huán)境的數(shù)據(jù)類(lèi)型各異,數(shù)據(jù)采集量達(dá)到上億級(jí),所以依據(jù)該場(chǎng)景以1 h為單位進(jìn)行分析。
1.4.1 郵件系統(tǒng)登錄數(shù)據(jù)中的字段定義
Affiliated_Network:郵件登錄IP所屬網(wǎng)絡(luò);
Server_IP:郵件服務(wù)器IP地址;
Login_IP:郵件賬號(hào)登錄IP地址;
Login_Account:郵件登錄賬號(hào);
LogIds:日志唯一標(biāo)識(shí)id;
Login_Longitude:郵箱登錄地址經(jīng)度;
Login_Latitude:郵箱登錄地址維度。
1.4.2 郵件賬號(hào)登錄事件流
設(shè)
a={ Affiliated_Network,Server_IP,Login_IP,Login_Account,LogIds,Login_Longitude,Login_Latitude}
1.4.3 郵件賬號(hào)異常登錄復(fù)雜事件EPL
事件描述:在
2次登錄的IP地點(diǎn)的距離大于飛機(jī)在2次登錄時(shí)間內(nèi)所飛行的最大距離,飛機(jī)時(shí)速按500 km/h計(jì)算。
1.4.4 生成賬號(hào)異常登錄告警的流程
啟動(dòng)Storm集群時(shí)將會(huì)啟動(dòng)3個(gè)拓?fù)洳⒓虞dEsper引擎,每個(gè)拓?fù)涫荢torm運(yùn)行的一個(gè)實(shí)時(shí)應(yīng)用程序。在本文設(shè)計(jì)的模型中,Storm中的3個(gè)拓?fù)浞謩e對(duì)應(yīng)所設(shè)計(jì)模型中的3個(gè)引擎。
1)主題去重去噪拓?fù)?mdash;—TopologySrc
對(duì)應(yīng)模型中的標(biāo)準(zhǔn)化引擎,TopologySrc將采集到的郵件登錄日志進(jìn)行識(shí)別、解析、分類(lèi)、去重、去噪,生成較為規(guī)整的數(shù)據(jù)流,發(fā)送到下一數(shù)據(jù)關(guān)聯(lián)加強(qiáng)的拓?fù)渲小?/span>
2)關(guān)聯(lián)加強(qiáng)拓?fù)?mdash;—TopologyConvert
對(duì)應(yīng)模型中的復(fù)雜事件語(yǔ)義分析引擎,將從上一個(gè)TopologySrc中標(biāo)準(zhǔn)化后的郵件登錄數(shù)據(jù)流發(fā)送到TopologyConvert,TopologyConvert將數(shù)據(jù)流與數(shù)據(jù)庫(kù)中的結(jié)構(gòu)化離線位置知識(shí)庫(kù)關(guān)聯(lián),加強(qiáng)出郵件登錄IP相關(guān)的位置信息,生成格式規(guī)范、信息完整的數(shù)據(jù)流。
3)分析拓?fù)?mdash;—TopologyAnalysis
對(duì)應(yīng)模型中的安全分析模型計(jì)算引擎,結(jié)合Esper引擎,經(jīng)過(guò)該步驟的事件流在Esper的1 h滑動(dòng)事件窗口中,讀取數(shù)據(jù)庫(kù)中的EPL語(yǔ)句進(jìn)行場(chǎng)景關(guān)聯(lián)分析,EPL語(yǔ)句如下:
①create window EmailLoginFail1h.win:time_batch(1 hour) as EmailLogin;EmailLoginFail1h為
1 h內(nèi)登錄失敗時(shí)間窗口。
②create schema HostLoginDistance as (Affiliated_Network string,Server_IP string,Login_IP string,Login_Account string,LogIds string,SlogStartId long,SlogEndId long,Reality double,FlyMax double);HostLoginDistance為創(chuàng)建的模式,模式中存儲(chǔ)服務(wù)器IP、登錄IP等關(guān)鍵信息及經(jīng)過(guò)計(jì)算的飛行信息。
③insert into HostLoginDistance select e1.Affiliated_Network as Affiliated_Network,concat(e1.Server_IP,e2.Server_IP) as Server_IP,concat(e1.Login_IP,e2.Login_IP) as Login_IP,concat(e1.SN,e2.SN) as LogIds,e1.Login_Account as Login_Account,e1.SN as SlogStartId,e2.SN SlogEndId,calcReal(e1.Login_Longitude,e1.Login_Latitude,e2.Login_Longitude,e2.Login_Latitude) as Reality,calcFly(500D,e1.Login_Time,e2.Login_Time) as FlyMax from pattern [every e1=HostLogin -> e2=HostLogin(e2.Login_Account=e1.Login_Account and e2.Affiliated_Network=e1.Affiliated_Network and e2.Login_IP!=e1.Login_IP)]。
④insert into EventWarning select Affiliated_Network as affiliatedNetwork,Login_IP as attackSrc,Server_IP as attackTarget,SlogStartId as slogStartId,SlogEndId as slogEndId,LogIds as logIds from HostLoginDistance(Reality>FlyMax)。
符合條件的日志事件插入告警窗口,并生成最終告警,生成后,同一源IP符合關(guān)聯(lián)分析規(guī)則的生成一條告警,在平臺(tái)告警界面展示,安全分析人員在看到告警后可以回溯告警相關(guān)日志,進(jìn)行其他人工分析,告警處置人員則需要與登錄異常IP的資產(chǎn)責(zé)任人聯(lián)系,進(jìn)行排查,如確實(shí)存在問(wèn)題則需封禁該源IP并按照公司內(nèi)部規(guī)定進(jìn)行其他處理操作。
以上安全關(guān)聯(lián)分析過(guò)程只需將去重去噪規(guī)則及郵件賬號(hào)異常登錄的復(fù)雜事件處理EPL固化存儲(chǔ)在數(shù)據(jù)庫(kù)中,待事件流到達(dá)自動(dòng)執(zhí)行進(jìn)行關(guān)聯(lián)分析,無(wú)需人工干預(yù),最終將大量的數(shù)據(jù)轉(zhuǎn)化成人工易于觀察的安全告警信息。場(chǎng)景規(guī)則EPL也可以通過(guò)交互式用戶界面自定義配置,配置后,Esper及Storm將重啟,熱加載將新配置的EPL規(guī)則作為大數(shù)據(jù)安全關(guān)聯(lián)分析的依據(jù)。
2 模型實(shí)現(xiàn)與應(yīng)用
本文設(shè)計(jì)的模型投入實(shí)際生產(chǎn)環(huán)境使用,模型的部署環(huán)境如下。
2.1 環(huán)境部署
使用了4臺(tái)Storm服務(wù)器組成的大數(shù)據(jù)分析集群,1臺(tái)數(shù)據(jù)庫(kù)服務(wù)器,1臺(tái)Web應(yīng)用服務(wù)器,均預(yù)裝CentOS 6.5的Linux發(fā)行版本,Java編譯環(huán)境(JDK 1.7)、Storm和Esper引擎。網(wǎng)絡(luò)結(jié)構(gòu)如
圖5 實(shí)際環(huán)境網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Real environment network structure
在大數(shù)據(jù)時(shí)代,機(jī)器的硬件已由以往的縱向拓展轉(zhuǎn)變?yōu)榱藱M向拓展,生產(chǎn)環(huán)境亦是如此,當(dāng)資源不夠時(shí),大數(shù)據(jù)集群可以在現(xiàn)有部署結(jié)構(gòu)的基礎(chǔ)上,擴(kuò)展服務(wù)器節(jié)點(diǎn)的數(shù)量,提高安全日志的數(shù)據(jù)分析處理能力。搭建好大數(shù)據(jù)集群后,將程序部署在各節(jié)點(diǎn),依照本文設(shè)計(jì)的模型實(shí)現(xiàn)大數(shù)據(jù)安全事件
分析。
2.2 實(shí)際運(yùn)行結(jié)果集分析
通過(guò)實(shí)際部署的環(huán)境及以上的操作步驟,實(shí)現(xiàn)了基于復(fù)雜事件處理的大數(shù)據(jù)安全事件分析模型的完整安全數(shù)據(jù)分析流程,并實(shí)現(xiàn)了依據(jù)預(yù)定義規(guī)則和用戶自定義建立攻擊模型進(jìn)而產(chǎn)生告警事件。在實(shí)際生產(chǎn)環(huán)境中,對(duì)采集裝置收集到的全量數(shù)據(jù)進(jìn)行處理,每天約采集到2億條來(lái)自不同系統(tǒng)、不同類(lèi)型的數(shù)據(jù),基于Storm的高吞吐性及Esper引擎的關(guān)聯(lián)規(guī)則處理,在峰值時(shí),每個(gè)worker每秒處理
2 000條數(shù)據(jù),一個(gè)Slave節(jié)點(diǎn)依據(jù)分配有3~4個(gè)worker,數(shù)據(jù)處理的速度優(yōu)于普通的數(shù)據(jù)處理速度,將海量數(shù)據(jù)快速識(shí)別、分解、標(biāo)準(zhǔn)化、分析,轉(zhuǎn)化為有用的信息,實(shí)現(xiàn)了大數(shù)據(jù)安全關(guān)聯(lián)分析實(shí)時(shí)、準(zhǔn)確的目標(biāo)。統(tǒng)計(jì)現(xiàn)場(chǎng)不同拓?fù)湓诓煌瑫r(shí)間節(jié)點(diǎn)處理的數(shù)據(jù)條數(shù),結(jié)果如
其中,影響不同拓?fù)涮幚硭俣鹊脑蛟谟冢呵爸猛負(fù)鋽?shù)據(jù)的輸出效率及每個(gè)拓?fù)涞臉I(yè)務(wù)實(shí)現(xiàn)邏輯,TopologySrc每時(shí)刻處理的數(shù)據(jù)量最大,因?yàn)門(mén)opologySrc處理的采集裝置通過(guò)消息隊(duì)列Kafka推送到Storm的數(shù)據(jù),而TopologySrc要做去重去噪會(huì)過(guò)濾掉一半左右不符合規(guī)范的數(shù)據(jù),故TopologyConvert中需處理的數(shù)據(jù)量就減少了。同時(shí),TopologyConvert是TopologyAnalysis的前置,這也決定了TopologyAnalysis處理的數(shù)據(jù)量。
3個(gè)拓?fù)渲兄挥蠺opologyAnalysis結(jié)合了Storm和Esper 2類(lèi)技術(shù),其余2個(gè)拓?fù)渲挥肧torm技術(shù)。
圖6 不同拓?fù)涞臄?shù)據(jù)處理效率Fig.6 Data processing efficiency of different topologies
從
3 結(jié)語(yǔ)
本文采用Storm及Esper引擎,在已有大數(shù)據(jù)處理技術(shù)及復(fù)雜事件處理技術(shù)的結(jié)合改進(jìn)基礎(chǔ)上,設(shè)計(jì)并實(shí)現(xiàn)了基于復(fù)雜事件處理的大數(shù)據(jù)安全關(guān)聯(lián)分析模型,達(dá)到了數(shù)據(jù)關(guān)聯(lián)分析生成告警的實(shí)時(shí)性、準(zhǔn)確性的高要求。同時(shí),在安全事件分析方法上采用了事件流語(yǔ)義分析、實(shí)時(shí)關(guān)聯(lián)分析兩種事件分析技術(shù)。與傳統(tǒng)的大數(shù)據(jù)安全分析方案相比,拋棄了人工的干預(yù),高效地關(guān)聯(lián)了事件關(guān)鍵信息,生成了實(shí)時(shí)告警,靈活實(shí)現(xiàn)了規(guī)則熱加載。所設(shè)計(jì)的模型投入生產(chǎn)環(huán)境中使用,有實(shí)際應(yīng)用價(jià)值。

責(zé)任編輯:售電衡衡
-
權(quán)威發(fā)布 | 新能源汽車(chē)產(chǎn)業(yè)頂層設(shè)計(jì)落地:鼓勵(lì)“光儲(chǔ)充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車(chē),產(chǎn)業(yè),設(shè)計(jì) -
中國(guó)自主研制的“人造太陽(yáng)”重力支撐設(shè)備正式啟運(yùn)
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng)
-
新基建助推 數(shù)據(jù)中心建設(shè)將迎爆發(fā)期
2020-06-16數(shù)據(jù)中心,能源互聯(lián)網(wǎng),電力新基建 -
泛在電力物聯(lián)網(wǎng)建設(shè)下看電網(wǎng)企業(yè)數(shù)據(jù)變現(xiàn)之路
2019-11-12泛在電力物聯(lián)網(wǎng) -
泛在電力物聯(lián)網(wǎng)建設(shè)典型實(shí)踐案例
2019-10-15泛在電力物聯(lián)網(wǎng)案例
-
新基建之充電樁“火”了 想進(jìn)這個(gè)行業(yè)要“心里有底”
2020-06-16充電樁,充電基礎(chǔ)設(shè)施,電力新基建 -
燃料電池汽車(chē)駛?cè)雽こ0傩占疫€要多久?
-
備戰(zhàn)全面電動(dòng)化 多部委及央企“定調(diào)”充電樁配套節(jié)奏
-
權(quán)威發(fā)布 | 新能源汽車(chē)產(chǎn)業(yè)頂層設(shè)計(jì)落地:鼓勵(lì)“光儲(chǔ)充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車(chē),產(chǎn)業(yè),設(shè)計(jì) -
中國(guó)自主研制的“人造太陽(yáng)”重力支撐設(shè)備正式啟運(yùn)
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長(zhǎng)期助力儲(chǔ)能行業(yè)發(fā)展
-
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng) -
5G新基建助力智能電網(wǎng)發(fā)展
2020-06-125G,智能電網(wǎng),配電網(wǎng) -
從智能電網(wǎng)到智能城市
-
山西省首座電力與通信共享電力鐵塔試點(diǎn)成功
-
中國(guó)電建公司公共資源交易服務(wù)平臺(tái)摘得電力創(chuàng)新大獎(jiǎng)
-
電力系統(tǒng)對(duì)UPS的技術(shù)要求