Google大數據技術架構探秘
Google是大數據時代的奠基者,其大數據技術架構一直是互聯網公司爭相學習和研究的重點,也是行業大數據技術架構的標桿和示范。
1、谷歌的數據中心
谷歌已經建立了世界上最快、最強大、最高質量的數據中心,它的8個主要數據中心都遠離其位于加州山景城的總部,分別位于美國南卡羅來納州的伯克利郡,愛荷華州的康瑟爾布拉夫斯,喬治亞州的道格拉斯郡,俄克拉荷馬州的梅斯郡,北卡羅來納州的勒努瓦,俄勒岡州的達爾斯;另外2個在美國境外,分別是芬蘭的哈米納和比利時的圣吉斯蘭。此外,谷歌公司還在中國香港和中國臺灣,以及新加坡和智利建立了數據中心。

2、谷歌新一代搜索引擎平臺和大數據分析核心技術
Google是GFS MapReduce BigTable的締造者,但Google 新一代搜索引擎平臺正逐步用更強計算能力的系統來替換原有系統,新一代搜索引擎平臺有幾個核心技術系統:
一是用基于Percolator的增量處理索引系統來取代MapReduce批處理索引系統,這個索引系統被稱作Caffeine,它比MapReduce批處理索引系統搜索更快。

二是專為BigTable設計的分布式存儲Colossus,也被稱為GFS2(二代Google文件系統),它專為建立Caffeine搜索索引系統而用。
三是列存儲數據庫BigTable,但為了更好地支持大數據集的互動分析,Google推出了Dremel和PowerDrill。Dremel被設計用來管理非常大量的大數據集(指數據集的數量和每數據集的規模都大),而PowerDrill則設計用來分析少量的大數據集(指數據集的規模大,但數據集的數量不多)時提供更強大的分析性能。四是為Google Instant提供服務的實時搜索引擎存儲和分析架構。
五是Pregel,這是谷歌更快捷的網絡和圖算法。
在谷歌新一代搜索引擎平臺上,每月40億小時的視頻,4.25億Gmail用戶,150,000,000 GB Web索引,卻能實現0.25秒搜索出結果。
3、谷歌基礎云服務
基于Colossus,谷歌為用戶提供計算、存儲和應用的云服務。計算服務包括計算的引擎(ComputeEngine)和應用APP的引擎(AppEngine);存儲服務包括云存儲(CloudStorge)、云SQL(CLoudSQL)、云數據存儲(Cloud DataStore)、永久磁盤等服務;云應用服務包括BigQuery、云終端(Cloud Endpoints)、緩沖、隊列等。
4、谷歌的大數據智能應用服務
Google提供的大數據分析智能應用包括客戶情緒分析、交易風險(欺詐分析)、產品推薦、消息路由、診斷、客戶流失預測、法律文案分類、電子郵件內容過濾、政治傾向預測、物種鑒定等多個方面。據稱,大數據已經給Google每天帶來2300萬美元的收入。例如,一些典型應用如下:
(1)基于Map Reduce,Google的傳統應用包括數據存儲、數據分析、日志分析、搜索質量以及其他數據分析應用。
(2)基于Dremel系統, Google推出其強大的數據分析軟件和服務 — BigQuery,它也是Google自己使用的互聯網檢索服務的一部分。Google已經開始銷售在線數據分析服務,試圖與市場上類似亞馬遜網絡服務(Amazon Web Services)這樣的企業云計算服務競爭。這個服務,能幫助企業用戶在數秒內完成萬億字節的掃描。
(3)基于搜索統計算法,Google推出搜索引擎的輸寫糾錯、統計型機器翻譯等服務。
(4)Google的趨勢圖應用。通過用戶對于搜索詞的關注度,很快的理解社會上的熱點是什么。對廣告主來說,它的商業價值就是很快的知道現在用戶在關心什么,他們應該在什么地方投入一個廣告。據此,Google公司也開發了一些大數據產品,如“Brand Lift in Adwords”、“Active GRP”等,以幫助廣告客戶分析和評估其廣告活動的效率。
(5)Google Instant。輸入關鍵詞的過程,Google Instant 會邊打邊預測可能的搜索結果。
谷歌的大數據平臺架構仍在演進中,追去的目標是更大數據集、更快、更準確的分析和計算。這將進一步引領大數據技術發展的方向。

責任編輯:廖生玨
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市