攜程癱瘓12小時或損失上千萬
新京報訊 5月28日11時起,攜程官網及APP無法使用,直至當天23時29分,才全面恢復正常。經攜程技術排查,確認此次事件是由于員工錯誤操作,刪除了生產服務器上的執行代碼導致。 在攜程宕機之前,5月份以來,
新京報訊 5月28日11時起,攜程官網及APP無法使用,直至當天23時29分,才全面恢復正常。經攜程技術排查,確認此次事件是由于員工錯誤操作,刪除了生產服務器上的執行代碼導致。
在攜程宕機之前,5月份以來,已有網易、支付寶錢包等網絡服務出現短暫的無法正常使用的現象。其中,5月11日晚上8時許,網易突然出現大面積服務癱瘓問題,網易新聞、云音樂、易信、有道云筆記等多款移動應用均無法正常刷新,網易名下的游戲也全線癱瘓,用戶長時間無法刷新和登錄。但第二天凌晨2點就已經恢復。5月27日17時左右,支付寶錢包出現故障。支付寶1小時后就找到故障原因,是杭州蕭山一處光纜被挖斷。
而攜程此次宕機,從發現到全面修復超過了12個小時。互聯網企業宕機,修復時間如此長的情況,比較少見。
為什么恢復時間那么長?攜程從技術角度對新京報記者解釋道,攜程后臺是一個由SOA(面向服務)架構組成的龐大服務器集群,一個頁面背后由上千個應用子系統以及上千個WebService組成,每個應用子系統和每個WebService之間存在著相互調用的依賴關系。事件發生后,攜程除需要恢復生產服務器上的執行代碼,還需要確保應用子系統和WebService的功能正常,以及兩者間的調用關系正常執行。這種驗證性的操作需要反復地、持續性地調試。
為杜絕此類事件的再次發生,攜程表示,已經在系統上做了改進,規范并杜絕技術人員錯誤刪除生產服務器上代碼的操作。攜程再次保證,數據和數據庫并未受到此次事件的影響,用戶訂單數據也完整無損。
除了消費者,攜程自身受到的影響也非常慘重。以攜程今年第一季度財報的數據計算,凈營收23億元,28日攜程相當于每小時損失106.5萬元的生意。以12小時計算,攜程大約少了1278萬元的業務收入。
■分析
互聯網脆弱企業該做什么?
不到一個月的時間里,主流互聯網企業中,就有網易、支付寶、攜程的服務器或系統先后“倒下”。對于互聯網賴以生存的網絡、設備、技術可能變“脆弱”的情況,企業應該怎么做?
安天首席架構師肖新光告訴記者,注意備份、備災非常重要。通常來說,大的互聯網企業都會有比較成熟的備份機制和應急預案等,通常可以做到小故障不影響用戶體驗(甚至讓用戶感知不到),局部故障可以快速恢復等等。
對于數據,熱備份和冷備份都已經是較為成熟的技術。通俗而言,熱備份是至少兩臺設備同時進行相同的數據操作,如果一個設備出現故障,可以快速切換到備用設備。冷備份是指,每隔一段時間進行一次數據復制,來確保一旦出現故障,至少可以恢復到接近當前的某個時刻,但恢復需要更多時間。
技術與方法等是相對比較成熟的,但同時也要看企業對整個系統的設計是否得當、投入是否足夠、管理是否有效。目前企業的相關投入更多對應的是一些自然事故,如服務器損壞、線路中斷、包括機房遭遇水災、火災等,但對于惡意攻擊、內部犯罪等防范的能力和防范投入往往還有一定欠缺。
對于重特大事故和事件(如長期策劃的蓄意入侵攻擊,特別是內部的攻擊),從最開始的一片混亂到有效處理,可能需要更長的時間。多數企業缺少對最壞狀況的演練。同時,如果立足于防范極限情況,也需要付出更多的日常成本。
作者:趙嘉妮
責任編輯:大云網
免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
-
發電電力輔助服務營銷決策模型
2019-06-24電力輔助服務營銷 -
繞過安卓SSL驗證證書的四種方式
-
網絡何以可能
2017-02-24網絡