雷濤:大數據不等于BI
雷濤:大數據不等于BI
天云大數據CEO 雷濤
為什么我說大數據不等于BI?
大數據和BI有很多對立。我們在項目實施中一直遵循這一原則。例如
1.全量思維。不用抽樣建模,再回到DW實施。大數據利用全量數據直接跑,先在大寬表中找到以前靠業務經營選擇的字段,即依靠機器學習建規則,再在全局數據中實施。大數據在這個層面首先是基礎設施,能夠完成以前不能完成的任務。例如某保險公司,SAS只能跑幾十萬用戶的一種分類模型,現在可以把個險3600萬用戶跑個全量,得到上千個分類,發現業務經營給不了事實。這是大數據的IT屬性,Hadoop分布式計算帶來的顛覆創新。
2. 個性化。 BI面向決策,面向人的干預。輸出形式更多的dashboard.report。因此對事實描述更多是基于群體共性,而不是個體刻畫。例如回到保險公司的例子,當我們用大數據計算出每一個個體客戶的流失風險概率,做個性化客戶視圖。而BI系統需要匯總成宏觀統計數據。前者幫助我們深刻的了解每一個用戶,適合于精準推薦類營銷類問題,回答How much how strong的程度類模糊問題;后者幫助決策者掌握宏觀統計趨勢,適合經營運營指標支撐類問題,準確回答yes or no的統計意義概率問題。
大數據對個體刻畫還是BI的群體描述,引發了下面第三種差異。
3. Insight or Automation群體共性的描述獲得的Yes or no的問題對于復雜經濟現象越來越難回答,維度指標越來越多。例如上面客戶流失風險的例子,被BI系統做成統計指標后匯報高層做決策,高層形成客戶挽留計劃一類的執行策略往往風險很大,包括質疑數據準確性,執行效率反饋周期等等,其結果就是面對這樣的宏觀不決策不作為。因此,某種意義上,BI形成的Insight,因為沒有形成閉環干預,而沒有發揮作用。
大數據強調Automation. 淘寶更強調為每一筆網購做自動推薦的生產系統。上面的保險客戶流失例子,大數據刻畫客戶后提供給一線銷售,數據服務下沉而不是匯總上報,每一個保險員做微決策微行動,風險小反饋及時。大數據更強調提供自動化工具,而不是統計報告。
4. 反饋和實驗方法 因為引入了Automation,和記錄行為數據,效果更直接及時。例如互聯網最多用的AB testing. Hulu每日上線的測試有200多個,可見測試方法在數據分析中的重要程度。
有機會展開談談BI和大數據,在這個概念泛濫的大數據熱炒時代,啤酒尿布少女懷孕黑人進白宮,各種公司一夜轉型大數據,如何辨別小數據和大數據,不僅是技術基礎,更重要的是思維方式。
責任編輯:葉雨田
-
曹志剛:我們期待風電成為中國的主力能源
2020-11-17風電,能源,主力能源 -
張鈞:未來配電網內涵特征與發展框架研究
2020-11-03配電網,智能配電網,智能配電網建設研討會 -
習近平:持續增強電力裝備、新能源等領域的全產業鏈優勢
2020-11-02電力裝備,新能源,通信設備
-
曹志剛:我們期待風電成為中國的主力能源
2020-11-17風電,能源,主力能源 -
張鈞:未來配電網內涵特征與發展框架研究
2020-11-03配電網,智能配電網,智能配電網建設研討會 -
杜祥琬:創新觀念,推動能源高質量發展
2020-09-28能源,創新,觀點
-
PPT丨王繼業:電力系統儲能發展與挑戰
2020-10-14儲能,電力儲能,儲能應用 -
奮斗姿態書寫人生底色 銀隆儲能“小哥哥”的職場進擊姿勢
2020-10-12銀隆新能源,儲能,新能源汽車 -
鄒驥:通過發展清潔能源 提高中國公信力
2020-06-28鄒驥,清潔能源,綠色低碳能源
-
習近平:持續增強電力裝備、新能源等領域的全產業鏈優勢
2020-11-02電力裝備,新能源,通信設備 -
重磅 | 發改委發文7月起電價降5%
2020-06-29國家發改委,企業,用電成本,電費 -
李克強:放寬配售電業務市場準入 推動建立市場決定能源價格機制
2019-10-12配售電業務市場準入