www涩-www黄网站-www黄色-www黄色com-国产免费拍拍视频在线观看网站-国产免费怕怕免费视频观看

論大數據分析的正確方法 應理智對待

2013-11-28 10:43:50 大云網  點擊量: 評論 (0)
據統計,從人類文明開始到2003年,人類共創造了5TB(兆億字節)的信息?,F在,同樣的數據量僅需兩天就能夠被創造出來,且速度仍在加快。如此龐大的數據量使數據分析復雜化,而大數據中的非結構化數據將加深這種

       據統計,從人類文明開始到2003年,人類共創造了5TB(兆億字節)的信息?,F在,同樣的數據量僅需兩天就能夠被創造出來,且速度仍在加快。如此龐大的數據量使數據分析復雜化,而大數據中的非結構化數據將加深這種復雜度。

  這種情況下,我們需要清楚:什么樣的數據應被保存。如果從整體性出發,數據采集和存貯算不上大數據,對海量數據進行分析計算之后的結果才有實際價值。這亦是大數據的價值所在。

  關于大數據數量,業內一種較為激進的觀點認為,“大數據”的叫法存在問題,因為數據只有“大”是沒有用處的。雖然數據無處不在,但唯有復用性強和可轉化成有用抽象信息的數據才更有價值。

  即使我們的數據搜集、處理能力逐漸增強,仍然要堅持“不是任何數據都重要”這一準則。對企業來講,具體需遵循兩點,一是堅持數據廣泛性,對內掌握企業內部分析數據,對外摸準用戶喜好和習慣;二是堅持數據關鍵性,從最重要處著手,把握數據復用性,達到最大價值又使成本最優化。

  《哈佛商業評論》近期發表了一篇題為“更大的數據會導致更好的決策嗎?”的文章,這篇文章提出警告,把重點放在量的方面將導致大錯誤。如今很多企業試圖通過龐大的數據量獲得利益,但只有少數企業真正取得成功,這是過分注重數據“量”帶來的弊端。

  大數據分析之數據質量與數據分享

  我們知道,要保證分析結果的準確性,必須確保被分析數據真實有效,至少絕大部分數據樣本要有質量保證。但在大量數據從數據源匯聚而來的過程中,難免有以次充好的數據混入。

  在淘寶網購時,賣家信用等級是買家購買與否的重要參考。為了提高產品銷售量,刷信用等級成了業內公開的秘密,伴隨著部分賣家弄虛作假、違規提高信用等級的過程,將產生大量失真數據,在欺騙消費者的同時,也會直接影響后期數據分析結果。

  其次,中國互聯網產業中,“數據割據”現象較嚴重,即掌握大量核心數據的幾大互聯網巨頭各自為戰,不愿分享。如掌握搜索數據的百度,掌握社交數據的騰訊,掌握消費數據的阿里巴巴,他們都意識到數據對于未來企業競爭力的重要性,因此不會將自己手中的數據籌碼輕易示人。

  仍舊以百度、騰訊、阿里巴巴為例,按照目前他們在中國互聯網的流行程度,我們可以大體估計同時使用這三種應用的用戶個體占互聯網總用戶數的比率,保守估計,達到50%不成問題。因此,這三方數據一旦實現共享,將能拼湊出一幅完整的網絡信息圖譜。反之,“數據割據”造成大數據斷層和片面性,使其利用價值大打折扣。

  CMIC認為,在大數據洪流洶涌襲來的當下,信息的流動才是重中之重,互聯網巨頭們的數據割據思維嚴重阻礙著整個產業的發展。尤其對于那些擁有大數據分析技術卻無大數據源的中下游企業來說,面臨“巧婦難為無米之炊”的窘境。

大云網官方微信售電那點事兒

責任編輯:小沈

免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
?
主站蜘蛛池模板: 欧美第一页草草影院浮力| 国产高清片| 亚洲一区二区影视| 国产视频合集| 久久免费视屏| 午夜日本一区二区三区| 一区二区三区久久精品| 国产欧美一区二区三区沐欲| 日本一级特黄特色大片免费视频 | 性国产精品| 成人高清毛片a| 韩日三级视频| 久久不射网| 日韩高清在线不卡| 亚洲国产精品a一区二区三区| 国产福利久久| 久久两性| 久久久国产免费影院| 五月桃花网婷婷亚洲综合| 亚洲精品久久久久久久无| 成人免费在线| 国产黄色片在线观看| 国产一区二区三区四区在线| 欧美三级黄色| 免费一级毛片在线播放视频| 亚洲欧美韩日| 亚洲国产成人久久一区www| 99久久精品免费视频| ffyybb免费福利视频| 国产91精品一区| 国产精品黑丝| 国产精品亚洲第一区二区三区| 美美女高清毛片视频黄的一免费| 久久免费国产视频| 日本精品一区二区三区在线视频一| 欧美一级毛级毛片| 特级片在线观看| 欧美成人免费观看bbb| 午夜爽爽爽| 欧美成人免费看片一区| 日本一区视频在线观看|