www涩-www黄网站-www黄色-www黄色com-国产免费拍拍视频在线观看网站-国产免费怕怕免费视频观看

一圖簡述大數據技術生態圈

2018-12-18 09:10:32 不可錯過的大數據  點擊量: 評論 (0)
大數據技術生態圈主要的組件都是為了方便大家從底層的MapReduce模型中脫離出來,用高層語言來做分布式計算

下面是一張生態圖,主要的組件都是為了方便大家從底層的MapReduce模型中脫離出來,用高層語言來做分布式計算,下文將分別為你作簡述。

一圖簡述大數據技術生態圈

1、HBase

是一個高可靠性、高性能、面向列、可伸縮的分布式存儲系統,利用HBase技術可在廉價PC Server上搭建起大規模結構化數據集群。像Facebook,都拿它做大型實時應用。

2、Hive

Facebook領導的一個數據倉庫工具,可以將結構化的數據文件映射為一張數據庫表,并提供完整的sql查詢功能,可以將sql語句轉換為MapReduce任務進行運行。其優點是學習成本低,可以通過類SQL語句快速實現簡單的MapReduce統計。像一些data scientist 就可以直接查詢,不需要學習其他編程接口。

3、Pig

Yahoo開發的,并行地執行數據流處理的引擎,它包含了一種腳本語言,稱為Pig Latin,用來描述這些數據流。Pig Latin本身提供了許多傳統的數據操作,同時允許用戶自己開發一些自定義函數用來讀取、處理和寫數據。在LinkedIn也是大量使用。

4、Cascading/Scalding

Cascading是Twitter收購的一個公司技術,主要是提供數據管道的一些抽象接口,然后又推出了基于Cascading的Scala版本就叫Scalding。Coursera是用Scalding作為MapReduce的編程接口放在Amazon的EMR運行。

5、Zookeeper

一個分布式的,開放源碼的分布式應用程序協調服務,是Google的Chubby一個開源的實現。

6、Oozie、Hadoop

一個基于工作流引擎的開源框架。由Cloudera公司貢獻給Apache的,它能夠提供對MapReduce和Pig Jobs的任務調度與協調。

7、Azkaban

跟上面很像,Linkedin開源的面向Hadoop的開源工作流系統,提供了類似于cron 的管理任務。

8、Tez

Hortonworks主推的優化MapReduce執行引擎,與MapReduce相比較,Tez在性能方面更加出色。

大云網官方微信售電那點事兒

責任編輯:滄海一笑

免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
?
主站蜘蛛池模板: 成人免费高清视频网址| 国产偷怕自拍| 久草视频免费在线播放| 国产97在线观看| 三级黄毛片| 久久国产精品99久久久久久牛牛| 国产成人亚洲精品91专区高清| 91国内精品久久久久怡红院| 日韩在线不卡一区在线观看| 久草免费在线视频观看| 亚洲欧美午夜| 精品一久久| 97久久精品午夜一区二区| 日韩不卡一区二区| 国产视频一区二区三区四区| 性欧美video另类bd| 国产一级在线观看视频| 亚洲天堂一区在线| 韩国19禁主播裸免费福利| 五月六月伊人狠狠丁香网| 国产一区二区在线观看免费| 91九色精品国产免费| 免费看v片网站| 午夜宅男宅女看在线观看| 国产一区二区亚洲精品| 亚洲精品美女在线观看播放| 国产一区二区三区高清| 欧美三级免费| 成人黄色毛片| 免费小视频在线观看| 色青青草原桃花久久综合| 国产精品日韩欧美一区二区三区| 性久久久久久久久| vvvv99日韩精品亚洲| 久久国产片| 亚洲精品一区二区综合| 成人三级视频| 久久99亚洲精品久久频| 亚洲成年人在线观看| 宅男69免费永久网站| 国产亚洲一区二区三区不卡 |