大數據時代 大數據安全
大數據安全背景
大數據時代,社會信息化和網絡化的發展導致數據爆炸式增長,全球數據量大約每兩年翻一番,這意味著人類在最近兩年產生的數據量相當于之前產生的全部數據量。大數據技術,悄然滲透到各個行業領域,逐漸成為一種生產要素發揮著重要作用。然而,大數據技術使得產率提高和生活方式改變的同時,隨之而來的安全挑戰已無法忽視。
2017年4月,全國信息安全標準化技術委員會2017年第一次工作組"會議周"在武漢召開。會上,《大數據安全標準化白皮書》正式發布。
《大數據安全標準化白皮書》由中國電子技術標準化研究院、清華大學、四川大學、阿里云計算有限公司等25家企事業單位共同編制,重點介紹了國內外的大數據安全法規政策、標準化現狀,重點分析了大數據安全所面臨的安全風險和挑戰,給出了大數據安全標準化體系框架,規劃了大數據安全標準工作重點,提出了開展大數據安全標準化工作的建議。全國信息安全標準化技術委員會將積極推動產學研用單位參與大數據安全標準化工作,開展大數據安全標準的研制,為大數據產業安全有序發展提供標準化支撐。
通過對當前典型大數據應用場景以及大數據產業發展現狀進行調研分析,大數據安全挑戰是由于其他差異而產生的。大數據環境和傳統數據環境之間的差異包括:
大數據收集,匯總和分析
用于存儲和容納大數據的基礎架構
應用于分析結構化和非結構化大數據的技術
由于優先考慮的是為大量數據提供速度,所以安全性通常放最后考慮;因為沒有對數據進行特定的分類存儲和傳輸。從而導致不同技術的整合引入了新的安全挑戰,產生了安全隱患。在大數據系統支持關鍵基礎設施的情況下,安全必須考慮在內。由于大數據系統是復雜且異構的,所以安全保障必須是整體性的,以確保服務的可用性和連續性。
在整個大數據平臺建設過程,從大數據應用中產生的各種問題,我們總結了下文中的各個需求,具體情況如下:
大數據平臺建設示意圖
運維入口:
開發人員賬號混用、操作無詳細記錄、高危險誤操作無法控制、敏感數據泄露。
應用入口:
敏感數據泄露、數據訪問無詳細記錄、應用冒名訪問開放接口。
典型的行業大數據安全挑戰
大數據技術在行業中的應用越發的廣泛,所暴露出來的大數據安全問題,越發嚴重。以下是對部分行業調查分析。
電子政務
政務大數據覆蓋行業范圍廣泛、數據結構多樣、關聯關系復雜,而且涉及大量個人隱私數據、國家敏感數據等重要數據,因此在開展政務大數據應用的同時,數據和平臺安全尤為重要。電子政務大數據面臨的安全風險和挑戰主要包括:
1) 平臺安全
大數據平臺是政府使用數據資源的基礎平臺,平臺安全是保障政府安全可靠利用數據資源的基礎。大數據平臺除了面臨傳統的惡意代碼、攻擊軟件套件、物理損壞與丟失等安全威脅外,由于自身架構要根據政府業務需求和安全要求變化不斷改進,因而產生傳統的身份認證、數據加密手段適用性問題。
2) 服務安全
構建基于互聯網的一體化公共服務平臺,面向公眾提供基于大數據的便民服務,是落實國家推進國家治理體系和治理能力現代化、建設服務型政府要求的重要任務。基于互聯網建設的政務在線服務窗口,是政務大數據為社會公眾服務的重要組成部分,便捷的互聯網應用環境下,在提質增優公共服務的同時也為便民服務帶來嚴峻的安全挑戰,需要應對基于Web 的攻擊、Web應用程序攻擊/注入攻擊、拒絕服務攻擊、網絡釣魚、用戶身份盜竊等威脅,抵御信息泄露、網絡癱瘓、服務中斷等安全風險。
3) 數據安全
各部門在開展業務和對政務大數據進行開發利用的同時,數據自身安全非常重要,涉及數據生命周期各階段相關的數據采集、數據傳輸、數據存儲、數據處理、數據交換、數據銷毀等活動。政府部門數據公開、行業間以及行業內部數據平臺化共享時的數據安全,是迫切需要解決的問題, 是大數據資源實現開放共享、相關"數據掘金"應用得以發展的關鍵。
4) 數據確權問題
政務數據的所有權、使用權、管理權涉及多個部門,特別是政府授權社會資本方搭建的公共服務系統所產生的數據,涉及個人隱私、國家經濟命脈,在進行大數據分析中,必須做到權責分明,厘清數據權屬關系,防止數據流通過程中的非法使用,保障數據安全流通。但是,目前數據權屬仍缺乏法律支撐,數據使用尤其跨境流動所產生的安全風險日益凸顯。
5) APT 攻擊防御
APT是黑客針對客戶所發動的網絡攻擊和侵襲行為,是一種蓄謀已久的"惡意網絡間諜威脅"。這種行為往往經過長期的經營與策劃,并具備高度的隱蔽性。APT攻擊以竊取核心資料為目的,對政府部門大數據應用產生重大安全威脅,因此必須在政務大數據中高度防范此類攻擊。
健康醫療
作為典型的實踐科學,醫學中有很多知識來源于經驗積累。而目前經驗積累的最直接、客觀的體現就是"數據"。因此,利用健康醫療過程中產生的海量數據,開發其潛在價值,使其助力健康醫療事業的發展,成為醫療行業、技術研發領域等相關有識之士共同努力的目標。健康醫療大數據在促進業務發展的同時,面臨的安全挑戰主要表現在:
1) 數據權屬不清
健康醫療大數據起源于個人患者本身,那么數據權屬到底是屬于個人、還是產生數據的醫療機構一直沒有定論;另外,第三方機構在原始數據基礎上挖掘延伸出的新數據,其歸屬權也沒有明確規定。
2) 應用復雜性高
目前各地區和機構在進行健康醫療領域信息化建設時大都根據自身需求建立獨立的信息系統,這些信息系統架構各異、數據格式不同,導致數據在安全共享、交換和處理時的復雜度大幅提升。
3) 個人隱私保護難
健康醫療數據中包含特別敏感的個人隱私信息,必須依法進行管控和保護;對涉及健康醫療數據的管理要以相應的法律法規做指導,在進行健康醫療數據的收集、存儲、挖掘等應用時,需要解決個人隱私保護的難題。
電商行業
電商行業作為基于互聯網技術衍生的新型業務,積累了大量商家數據、買家數據、商品數據,以及在買賣交易過程中產生的訂單數據、交易數據和用戶行為數據等。借助大數據技術發展契機,電商行業也開始了大數據時代的轉型。電商行業基于長期積累的海量數據,開始在不同業務方向利用大數據技術分析、挖掘數據價值。電商行業大數據在促進業務發展的同時,相應的安全挑戰也隨之浮現,主要表現在:
1) 數據權屬不清
電商業務的開展主要包括電商平臺、商家和消費者三方,電商業務產生的數據如何劃分其所有權、控制權和使用權,是在電商業務中合理使用數據的前提。當前電商業務的大數據應用中,通常利用電商平臺對數據進行分析,也存在商家或商家授權獨立軟件提供商使用商家數據進行分析的情況,在權利歸屬不明確的情況下,責任的歸屬也難以界定,相關數據安全難以保障。
2) 大數據聚合分析風險
電商業務的大數據應用涉及對消費者相關的數據分析,雖然可以通過隱私保護政策、用戶授權協議的形式獲取相關數據的使用合法授權,而且在對電商業務分析的過程中也會采用匿名化處理的方式,保證用戶的個人信息安全。但是,在對大數據加工計算的過程中,如何保障不會因為大數據的聚合分析而實現"去匿名化",依然是亟待解決的難題。
3) 數據版權保護
電商生態圈內的數據流動和共享較為普遍,目前主要通過法律協議方式約束對數據的使用。但由于缺乏有效的數據版權保護技術手段及措施, 難以甄別是否存在超出范圍的數據擴散或使用問題。
4) 數據跨境安全
目前國家大力支持跨境電商業務,而跨境電商業務必然涉及數據的跨境問題。不同國家和地區的數據保護法規對數據跨境流動的要求存在差異性,比如俄羅斯明確提出俄羅斯公民的數據應在俄羅斯境內更新后方可傳到海外進行處理;歐盟則擴大了數據保護法律適用的管轄范圍。這些法規將給跨境電商企業帶來高昂的合規成本,制約了跨境電子商務的發展。如何處理數據跨境安全合規與跨境電商戰略發展的矛盾,是亟待解決的難題。
電信行業
電信運營商擁有大量的數據資源,如網絡信息、用戶終端信息、用戶位置信息等,同時電信行業近年來利用大數據進行深度挖掘分析,將豐富的網絡、用戶等數據資源加工抽取后封裝為服務,向客戶提供。大數據給電信行業帶來新的發展機遇,電信運營商借助已有的數據積累優勢,不斷發展大數據應用,但同時數據的集中管理、數據對外開放等新技術特點和業務新形態應用,也使電信行業大數據面臨新的安全風險和挑戰,主要包括:
1) 供應鏈安全
通信數據在移動網絡設備中產生,而這些設備是由多家供應商提供。同時,存在大數據平臺系統第三方供給代建設、代維護等問題,在特定階段,部分設備的操作權在供應商手中,這意味著供應鏈的各環節存在安全風險。
2) 數據集中管理
在大數據業務應用發展的驅動下,電信運營商的數據由原來的各系統分散存儲轉變為大數據平臺集中存儲模式,大數據資源的安全風險更加集中,一旦發生安全事件將涉及海量客戶信息及公司數據資產。
3) 平臺組件開源
大數據平臺多使用開源軟件,這些軟件設計初衷主要考慮高效數據處理,缺乏安全性保障,滯后于電信業務發展的安全防護能力,存在安全隱患。
4) 敏感數據共享
在電信運營商內部信息系統建設相對分散,敏感數據跨部門、跨系統共享留存比較常見,其中一旦存在系統安全防護措施不當,均可能發生敏感數據泄漏,造成"一點突破、全網皆失"的嚴重后果。
大數據應用安全實踐
我們在推廣大數據應用的同時,大數據的安全問題不容忽視。需要推動大數據安全關鍵技術和大數據安全解決方案的研究。從以上的各個行業分析情況來看,各個行業大數據安全問題大同小異,主要存在:認證,授權,審計,加密等方面的安全管控問題,合眾大數據安全管控系統(以下簡稱:DSM系統),實現了可視化的大數據平臺用戶管理,網關代理配置及自動化部署,權限、脫敏規則配置,告警通知配置及展示,審計日志展示及報表展示功能等,實現在網關上對用戶訪問大數據平臺組件做用戶鑒權、權限控制、數據脫敏、安全審計等的功能,以滿足客戶大數據平臺自身安全管控的需求。
DSM架構圖
DSM總體目標是實現大數據平臺的用戶安全和數據安全,用戶安全是指訪問大數據平臺的用戶,其身份認證的安全、權限控制的安全,保證合法的用戶能夠訪問大數據平臺上指定的組件和數據。數據安全是指存儲在大數據平臺上的數據的安全,包括數據全生命周期的整體安全,包括數據源的安全、數據加密、數據脫敏、數據訪問的審計等方面。
典型案例分析
電信,聯通,移動三大運營商通過了大數據安全管控系統,實現的是Hive、HBase、Impala、Spark SQL的網關,利用代理式網關訪問后端數據平臺實現靈活的數據脫敏等安全防護功能:
限制了所有人員及應用程序對Hive、HBase、Impala、Spark SQL的訪問,網關能夠對訪問行為進行鑒權及數據脫敏,防止惡意用戶即程序訪問大數據平臺進行非法操作。
網關引擎是部署在大數據平臺數據庫組件與應用之間,可以將網關當作大數據平臺的一層防火墻,外部攻擊首先需要沖破網關的保護才能進一步攻擊大數據平臺,增加惡意用戶的攻擊難度。
在網關側實現了對Hive、Impala、Spark SQL、HBase的實時數據脫敏功能。實時脫敏技術是通過網關解析內部協議,與應用層無關,因此不影響上層應用開發。
通過大數據管控平臺DSM解決了運營商行業所面臨的大數據安全管控問題,未來隨著大數據安全訴求的增加,將在電力、金融、電子商務、軍工等行業進行部署,實現各個行業的大數據平臺得到安全管控,保護大數據系統安全,業務安全,數據安全。
-
Kubernetes為什么會逐漸成為云計算的標準?
2018-01-18標準 -
云計算成朝陽產業,未來發展已成趨勢
-
2018關于云計算的五個預測:容器、AI、定制云
2018-01-18容器