大數據并不等同于BI
全量思維。不用抽樣建模,再回到DW實施。大數據利用全量數據直接跑,先在大寬表中找到以前靠業務經營選擇的字段,即依靠機器學習建規則,再在全局數據中實施。大數據在這個層面首先是基礎設施,能夠完成以前不能完成的任務。這是大數據的IT屬性,Hadoop分布式計算帶來的顛覆創新。
個性化。BI面向決策,面向人的干預。輸出形式更多的dashboard.report。因此對事實描述更多是基于群體共性,而不是個體刻畫。而BI系統需要匯總成宏觀統計數據。前者幫助我們深刻的了解每一個用戶,適合于精準推薦類營銷類問題,回答Howmuchhowstrong的程度類模糊問題;后者幫助決策者掌握宏觀統計趨勢,適合經營運營指標支撐類問題,準確回答yesorno的統計意義概率問題。
大數據對個體刻畫還是BI的群體描述,引發了下面的差異。
InsightorAutomation群體共性的描述獲得的Yesorno的問題對于復雜經濟現象越來越難回答,維度指標越來越多。某種意義上,BI形成的Insight,因為沒有形成閉環干預,而沒有發揮作用。大數據強調Automation.淘寶更強調為每一筆網購做自動推薦的生產系統。上面的保險客戶流失例子,大數據刻畫客戶后提供給一線銷售,數據服務下沉而不是匯總上報,每一個保險員做微決策微行動,風險小反饋及時。大數據更強調提供自動化工具,而不是統計報告。
反饋和實驗方法因為引入了Automation,和記錄行為數據,效果更直接及時。例如互聯網最多用的ABtesting.Hulu每日上線的測試有200多個,可見測試方法在數據分析中的重要程度。有機會展開談談BI和大數據,在這個概念泛濫的大數據熱炒時代,各種公司一夜轉型大數據,如何辨別小數據和大數據,不僅是技術基礎,更重要的是思維方式。
責任編輯:和碩涵
-
發電電力輔助服務營銷決策模型
2019-06-24電力輔助服務營銷 -
繞過安卓SSL驗證證書的四種方式
-
網絡何以可能
2017-02-24網絡