對大數據的理解與思考
首先,大數據的到來,對人們的觀念將帶來深遠的影響。 我們以前習慣認為:找到現象背后的原因,比清楚現象是什么更重要。通過塔吉特懷孕預測的例子可以看到,通過關聯分析、聚類分析等數據挖掘方
首先,大數據的到來,對人們的觀念將帶來深遠的影響。
我們以前習慣認為:找到現象背后的原因,比清楚現象是什么更重要。通過“塔吉特懷孕預測”的例子可以看到,通過關聯分析、聚類分析等數據挖掘方法,大家很容易找到事物之間的關系。但是,這些大數據分析結果,并不會直接告訴我們,事物之間為什么存在這些關系。在不清楚為什么存在這些關系之前,又的確看到了這些關系帶來了價值;所以,在大數據應用領域就需要改變以前的思考方。即:先找到“是什么”再去找“為什么”;清楚是什么,與搞清楚為什么同等重要。
手工統計時代,出于收集全部數據非常困難或代價巨大的原因,很多數據分析都是采用抽樣數據;但是,現在不同了,隨著信息技術的發展,現在很多領域都能夠方便的收集到全量數據。諸如無紙化辦公的興起、信息系統的使用、電子商務的發展等等,都為收集全量數據提供了便捷的條件。那么,這時候數據的“樣本”=“全體數據”。這相對以前來說,也是革命性的影響。
在抽樣分析時代,個別樣本的質量甚至決定結果的質量。在大數據時代,這也變了,可以允許個別數據的不精確,甚至錯誤。舉個簡單例子來說明這個道理,比如在溫室大棚里放一只溫度計,當這只溫度計有問題時,整個溫度都是不準確的。若在大棚里均勻分布十幾只溫度計,其中一只有問題,對溫室大棚溫度的統計結果無礙大事,基本可以忽略其影響。
其次,大數據應用,影響商業變革和社會進步。
大數據應用正改變著企業的業務發展方式。比如:京東、天貓通過對交易數據的“二次利用”,尋找目標客戶、定向推薦商品。也正是這些數據的二次利用給他們提供了大量價值,促進了這些企業的發展,推動著他們在營銷、供應鏈與客戶服務等領域的管理變革。同時,交易數據并不因為二次利用,而降低其價值;這也是,大數據應用與傳統資源使用不同的地方。
數據的“混搭”分析,推動著商業發展和社會的進步。比如歷史天氣信息與航班誤點信息,這兩個不同領域的信息一塊兒分析,便可以推算未來幾天航班的誤點率。再比如,通過神經中樞腫瘤患病率和手機使用時間長短之間的大數據關聯分析,來研究神經中樞腫瘤患病率是否與手機使用時間長短有關系等等。
大數據的應用,也促生了很多商業機會。隨著大數據時代的到來,形成了很多大數據擁有公司,以及大數據技術公司;數據與技術的結合變促生了很多大數據應用,因此帶來了很多商業機會。例如,現在很多商業銀行對自己大量客戶的交易信息分析,規劃新的理財產品,與其他商家合作,聯合搞定向促銷等等。
再次,大數據時代不再有個人隱私,將形成新的信息安全機制。
現在還經常聽到諸如某某窺探我的隱私之類的話語,但是,在大數據時代幾乎沒有個人隱私,這不是駭人聽聞。因為,現在微博、搜索引擎、社交網絡、電商購物,已經成了我們生活中必不可少的一部分。根據每個人在互聯網上留下的痕跡,通過大數據分析,很容易分析出一個人的愛好、習慣、性格、癖好等等。所以,大家都被“第三只眼”實時監控著,在大數據時代,幾乎沒有個人隱私!
沒有個人隱私,是否就代表每個人可以隨便傳播別人隱私了呢?答案當然是否定的。因為傳播別人隱私是不道德的,甚至是違法的。所以,現在新的信息安全規則正在重新定位,其中一個基調是:讓數據使用者承擔責任,不能濫用別人的隱私;我個人感覺這也比較合理。
我們以前習慣認為:找到現象背后的原因,比清楚現象是什么更重要。通過“塔吉特懷孕預測”的例子可以看到,通過關聯分析、聚類分析等數據挖掘方法,大家很容易找到事物之間的關系。但是,這些大數據分析結果,并不會直接告訴我們,事物之間為什么存在這些關系。在不清楚為什么存在這些關系之前,又的確看到了這些關系帶來了價值;所以,在大數據應用領域就需要改變以前的思考方。即:先找到“是什么”再去找“為什么”;清楚是什么,與搞清楚為什么同等重要。
手工統計時代,出于收集全部數據非常困難或代價巨大的原因,很多數據分析都是采用抽樣數據;但是,現在不同了,隨著信息技術的發展,現在很多領域都能夠方便的收集到全量數據。諸如無紙化辦公的興起、信息系統的使用、電子商務的發展等等,都為收集全量數據提供了便捷的條件。那么,這時候數據的“樣本”=“全體數據”。這相對以前來說,也是革命性的影響。
在抽樣分析時代,個別樣本的質量甚至決定結果的質量。在大數據時代,這也變了,可以允許個別數據的不精確,甚至錯誤。舉個簡單例子來說明這個道理,比如在溫室大棚里放一只溫度計,當這只溫度計有問題時,整個溫度都是不準確的。若在大棚里均勻分布十幾只溫度計,其中一只有問題,對溫室大棚溫度的統計結果無礙大事,基本可以忽略其影響。
其次,大數據應用,影響商業變革和社會進步。
大數據應用正改變著企業的業務發展方式。比如:京東、天貓通過對交易數據的“二次利用”,尋找目標客戶、定向推薦商品。也正是這些數據的二次利用給他們提供了大量價值,促進了這些企業的發展,推動著他們在營銷、供應鏈與客戶服務等領域的管理變革。同時,交易數據并不因為二次利用,而降低其價值;這也是,大數據應用與傳統資源使用不同的地方。
數據的“混搭”分析,推動著商業發展和社會的進步。比如歷史天氣信息與航班誤點信息,這兩個不同領域的信息一塊兒分析,便可以推算未來幾天航班的誤點率。再比如,通過神經中樞腫瘤患病率和手機使用時間長短之間的大數據關聯分析,來研究神經中樞腫瘤患病率是否與手機使用時間長短有關系等等。
大數據的應用,也促生了很多商業機會。隨著大數據時代的到來,形成了很多大數據擁有公司,以及大數據技術公司;數據與技術的結合變促生了很多大數據應用,因此帶來了很多商業機會。例如,現在很多商業銀行對自己大量客戶的交易信息分析,規劃新的理財產品,與其他商家合作,聯合搞定向促銷等等。
再次,大數據時代不再有個人隱私,將形成新的信息安全機制。
現在還經常聽到諸如某某窺探我的隱私之類的話語,但是,在大數據時代幾乎沒有個人隱私,這不是駭人聽聞。因為,現在微博、搜索引擎、社交網絡、電商購物,已經成了我們生活中必不可少的一部分。根據每個人在互聯網上留下的痕跡,通過大數據分析,很容易分析出一個人的愛好、習慣、性格、癖好等等。所以,大家都被“第三只眼”實時監控著,在大數據時代,幾乎沒有個人隱私!
沒有個人隱私,是否就代表每個人可以隨便傳播別人隱私了呢?答案當然是否定的。因為傳播別人隱私是不道德的,甚至是違法的。所以,現在新的信息安全規則正在重新定位,其中一個基調是:讓數據使用者承擔責任,不能濫用別人的隱私;我個人感覺這也比較合理。

責任編輯:廖生玨
免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市