有誰愿意生活在“數據王國”?
在數據王國里,你活動的7-24個小時都被一些所謂的研究員跟蹤。在數據驅動社會進步的同時,或許我們該關注下一切以數據為中心的負面社會效果。 盡管,我們常常為數據分析工具的缺點而憤怒,但是換位思考下,
在“數據王國”里,你活動的7-24個小時都被一些所謂的研究員跟蹤。在數據驅動社會進步的同時,或許我們該關注下一切以數據為中心的負面社會效果。
盡管,我們常常為數據分析工具的缺點而憤怒,但是換位思考下,這些缺點的存在,也許是一件好事。試想下,有誰愿意生活在“數據王國”呢?當一個人的7-24個小時都被跟蹤,比如吃飯、睡覺,以及身體和思想上的實時狀態都被監控和分析;當我們從一個房間走向另外一個房間,溫度變化會引導我們如何有效利用能源;當我們離開家的時候,導航會告訴我們可能會出現哪些麻煩……只有工作或者信貸優惠才與我們的生活方式匹配。
這是烏托邦式的理想社會還是脫離現實的空想主義? “在數據王國里,數據比你知道的更多、更真實。” 微軟研究院首席研究員Kate Crawford說到。同時,Kate Crawford揭穿了四個大數據神話。
神話1:數據是客觀的
Crawford說道,當她聽到數據開始主導一切時,她開始有些擔心,在大規模的數據收集和預測分析中,我們可以得到多少事實真相。
一些社會公共部門的政策,受Twitter和其他社交網絡圖片數據影響比較大。但是當颶風襲擊了東海岸時,你可能會認為來自Twitter上的數據分析能預測到颶風造成的損失。但這不是事實,因為災難發生的地方人們不能使用微博。一個國家不能只依靠微博來預測、分析和決策。
同樣,來自搜索引擎的數據也不見得靠譜。在谷歌流感趨勢預測中,一直通過一個有效的算法來跟蹤流感的爆發,但是今年卻預測失敗,給疾控中心帶來了雙倍的損失。
“數據不是一個自然資源,我們可以像開采石油一樣不斷挖掘。” Crawford表示。“有時候數據是人類創造力和思想的結合,從這個意義上來看,我們需要思考如何有效使用和保護數據。”
神話2:數據之下人人平等
“數據不是色盲,不能分辨性別,營銷人員可以使用數據更加精確地分析你。” Crawford說道。她提到,一項劍橋大學的研究發現,你可以用一個人的Facebook分析他的喜好,準確率高達95%,他們的性別、種族、宗教信仰和他們是否使用毒品或酒精。但是你不能隨意使用這些數據,只有政府機構或者其他秘密機構人員才可以使用,因為這是法律規定。
神話3:數據可以伸張正義
在虛擬世界里,到處是表達負面觀點的地方,企業可以允許他們發表評論,也可以控制這些人的表達權限。在美國的一篇文章中有一個觀點,富人和窮人在網絡里看到的是不同的內容。
Crawford說道,企業甚至不需要數據工具來排除。他們可以看到人們的在線活動和社交圖,可以使用預測模型來決定哪些人是他們的目標。她引用了最近的一個實例,通過她的購買目標,就可以知道一個十幾歲的女孩懷孕了的信息,這個女孩的家人還不知情,但商家已經在給她發送一些與妊娠物品相關的優惠券了。但這侵犯了個人隱私。Crawford 指出,“我們不知道還有多少這樣的侵犯。”
神話4:數據是虛擬的
“在互聯網上,沒人知道你是一條狗。”,這種觀點錯誤的,因為智能手機的出現,可能會暴漏你所有的信息。雖然,很多數據是匿名形式,但是通過分析你只要在4個地方或者四次同樣的時間與同一批人互動,你的數據即被曝光,因為你登陸的路徑是一致的。這也就是為什么那么多匿名數據被收集和出售的原因,因為通過很多方式還是能分辨出我們的身份。更可怕的是,我們的手機里有我們聯系的朋友和家人等所有私人信息。
更糟糕的是,有應用,“露天礦“我們的手機,把我們所有的信息,包括聯系信息為我們的朋友和家人。在數據王國里,有太多我們的個人身份信息。
“我們需要更嚴格的數據道德規范。” Crawford 強調。“數據與我們形影相隨,我們不能在沒有保護、沒有選擇的前提下去建立一個系統,如果不注意這點,數據災難就變得岌岌可危。
盡管,我們常常為數據分析工具的缺點而憤怒,但是換位思考下,這些缺點的存在,也許是一件好事。試想下,有誰愿意生活在“數據王國”呢?當一個人的7-24個小時都被跟蹤,比如吃飯、睡覺,以及身體和思想上的實時狀態都被監控和分析;當我們從一個房間走向另外一個房間,溫度變化會引導我們如何有效利用能源;當我們離開家的時候,導航會告訴我們可能會出現哪些麻煩……只有工作或者信貸優惠才與我們的生活方式匹配。
這是烏托邦式的理想社會還是脫離現實的空想主義? “在數據王國里,數據比你知道的更多、更真實。” 微軟研究院首席研究員Kate Crawford說到。同時,Kate Crawford揭穿了四個大數據神話。
神話1:數據是客觀的
Crawford說道,當她聽到數據開始主導一切時,她開始有些擔心,在大規模的數據收集和預測分析中,我們可以得到多少事實真相。
一些社會公共部門的政策,受Twitter和其他社交網絡圖片數據影響比較大。但是當颶風襲擊了東海岸時,你可能會認為來自Twitter上的數據分析能預測到颶風造成的損失。但這不是事實,因為災難發生的地方人們不能使用微博。一個國家不能只依靠微博來預測、分析和決策。
同樣,來自搜索引擎的數據也不見得靠譜。在谷歌流感趨勢預測中,一直通過一個有效的算法來跟蹤流感的爆發,但是今年卻預測失敗,給疾控中心帶來了雙倍的損失。
“數據不是一個自然資源,我們可以像開采石油一樣不斷挖掘。” Crawford表示。“有時候數據是人類創造力和思想的結合,從這個意義上來看,我們需要思考如何有效使用和保護數據。”
神話2:數據之下人人平等
“數據不是色盲,不能分辨性別,營銷人員可以使用數據更加精確地分析你。” Crawford說道。她提到,一項劍橋大學的研究發現,你可以用一個人的Facebook分析他的喜好,準確率高達95%,他們的性別、種族、宗教信仰和他們是否使用毒品或酒精。但是你不能隨意使用這些數據,只有政府機構或者其他秘密機構人員才可以使用,因為這是法律規定。
神話3:數據可以伸張正義
在虛擬世界里,到處是表達負面觀點的地方,企業可以允許他們發表評論,也可以控制這些人的表達權限。在美國的一篇文章中有一個觀點,富人和窮人在網絡里看到的是不同的內容。
Crawford說道,企業甚至不需要數據工具來排除。他們可以看到人們的在線活動和社交圖,可以使用預測模型來決定哪些人是他們的目標。她引用了最近的一個實例,通過她的購買目標,就可以知道一個十幾歲的女孩懷孕了的信息,這個女孩的家人還不知情,但商家已經在給她發送一些與妊娠物品相關的優惠券了。但這侵犯了個人隱私。Crawford 指出,“我們不知道還有多少這樣的侵犯。”
神話4:數據是虛擬的
“在互聯網上,沒人知道你是一條狗。”,這種觀點錯誤的,因為智能手機的出現,可能會暴漏你所有的信息。雖然,很多數據是匿名形式,但是通過分析你只要在4個地方或者四次同樣的時間與同一批人互動,你的數據即被曝光,因為你登陸的路徑是一致的。這也就是為什么那么多匿名數據被收集和出售的原因,因為通過很多方式還是能分辨出我們的身份。更可怕的是,我們的手機里有我們聯系的朋友和家人等所有私人信息。
更糟糕的是,有應用,“露天礦“我們的手機,把我們所有的信息,包括聯系信息為我們的朋友和家人。在數據王國里,有太多我們的個人身份信息。
“我們需要更嚴格的數據道德規范。” Crawford 強調。“數據與我們形影相隨,我們不能在沒有保護、沒有選擇的前提下去建立一個系統,如果不注意這點,數據災難就變得岌岌可危。
責任編輯:小沈
免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市