大數據產業“黃金期”面臨四道坎
《經濟參考報》記者從工信部、發改委等部委了解到,兩會前后,大數據系列推進政策將密集推出,國家政策將為今年大數據產業的快速成長提供良好的發展環境。
業內預期,我國大數據產業正在從起步階段步入黃金期,2020年中國有望成世界第一數據資源大國,但數據開放度低、技術薄弱、人才缺失、行業應用不深入等難題亟待解決。
數據成為關鍵生產要素
新年伊始,中央網信辦、國家發改委、工業和信息化部聯合印發《公共信息資源開放試點工作方案》,確定在北京、上海、浙江、福建、貴州5省份開展公共信息資源開放試點。
上述方案要求,試點地區要結合實際抓緊制定具體實施方案,明確試點范圍,細化任務措施,積極認真有序開展相關工作,著力提高開放數據質量、促進社會化利用,探索建立制度規范,于2018年底前完成試點各項任務。
工信部信軟司副司長李冠宇表示,“我國大數據產業頂層設計不斷加強,政策機制日益健全。發改委、工信部、網信辦等46個部委共同建立了促進大數據發展部際聯席會議制度,全國有30多個省市制定實施了大數據相關的政策文件。”
業內預期,2018年,隨著國家大數據戰略推進實施以及配套政策的貫徹落實,大數據產業發展環境將進一步優化,社會經濟各領域對大數據服務的需求將進一步增強,大數據的新技術、新業態、新模式將不斷涌現,產業規模將繼續保持30%以上的高速增長態勢。
記者從工信部了解到,今年,隨著八大國家大數據綜合實驗區建設不斷加快,產業發展將推動形成特色領域。圍繞京津冀和珠三角跨區域類綜合試驗區,將更加注重數據要素流通,以數據流引領技術流、物質流、資金流、人才流,支撐跨區域公共服務、社會治理和產業轉移,促進區域一體化發展;圍繞上海、重慶、河南和沈陽四大區域示范類綜合試驗區,將更加注重數據資源統籌,加強大數據產業集聚,發揮輻射帶動作用,促進區域協同發展,實現經濟提質增效;圍繞內蒙古基礎設施統籌發展類綜合試驗區,將在充分發揮區域能源、氣候、地質等條件基礎上,加大資源整合力度,強化綠色集約發展,加強與東、中部產業、人才、應用優勢地區合作,實現跨越發展。此外,結合地方產業發展和應用特色,大數據產業集聚區和大數據新型工業化產業示范基地建設也將持續推進。
權威數據顯示,預計2020年,我國大數據市場規模將超過8000億元,未來中國將成為全球數據中心。IT技術的持續創新促使大數據時代加速到來,在此大背景下,數據成為關鍵的生產要素,預計到2020年,全球的數據總量將達到40ZB,中國的數據量將占全球數據總量的20%,成為世界第一大數據資源大國。
目前,我國大數據產業生態系統日趨完善,大數據技術、交易、開放共享、工業大數據等產業鏈縱向發展逐步延伸;重點區域產業布局有效推進。在行業應用中,預計到2020年,工業大數據的占比將達到6.64%。
中關村大數據產業聯盟副秘書長陳新河表示,中國大數據產業發展呈現出政府與企業聯動的態勢,近幾年國內培育出了一批大數據創新企業,發展勢頭良好。
在美國納斯達克上市的中國第一家大數據公司——國雙公司財報顯示,其凈收入增速是行業平均水平的2倍。外界預計,其2018年營收將達10億元。
國雙迄今不僅為包括中國政府網、國家發改委、農業部、北京市等在內的3000多家政府網站提供大數據分析服務,還為國家發改委、國家林業局、稅務總局等眾多單位提供政策大數據互聯網分析服務,同時也為旅游、政府招商引資、地方產業促進、電子政務等垂直領域提供大數據整體解決方案。
“在新媒體領域,主要針對傳統廣電系統新媒體轉型、三網融合、三屏互動的需求,提供融合媒體大數據解決方案,為新媒體運營與運維、節目創新、全媒體收視考核及領導決策提供即時的全媒體數據支持。”國雙公司有關負責人表示。
中關村大數據產業聯盟有關人士表示,國內另外一家大數據創新公司——百分點集團已率先構筑行業領先、涵蓋多個行業的人工智能場景解決方案,尤其是工業和政務大數據解決方案,對國內工業和政務大數據轉型起到了良好的助推作用。
百分點集團副總裁兼EBG事業部總裁高體偉介紹,百分點智能制造全價值鏈一體化平臺已成功應用于汽車制造、3C制造、消費品制造等眾多行業,幫助企業實現設備異常監控與預測、零件生命周期預測、良品保固分析、產品精準營銷、個性化推薦,以及產品購買用戶的情感分析、產品優化設計、品質追溯查詢等,助力制造企業在生產、管理和營銷各環節的轉型。
據了解,百分點通過對用戶數據、日志數據、家電機器狀態等數據的分析發現,智能電視用戶使用VGA接口的人不到1%,為一家生產制造企業節約幾千萬元成本。
四大難題亟待破解
去年,菜鳥和順豐的“數據斷交”事件,暴露出大數據發展中的數據共享難題。當前,我國大數據產業正在從起步階段步入黃金期,數據開放度低、技術薄弱、人才缺失、行業應用不深入等都成為產業發展中亟待解決的問題。
首先,記者通過在貴陽、杭州、北京等地的采訪了解到,我國信息數據資源80%以上掌握在各級政府部門手中。近年來,在《關于推進公共信息資源開放的若干意見》《政務信息系統整合共享實施方案》等文件的推動下,政府數據加快了共享開放的步伐,惠民成績單亮點不斷。然而,由于我國大數據發展還處在起步階段,不少基礎性、關鍵性數據仍被政府部門束之高閣,共享開放程度低,這已經成為現代化治理進程中的“路障”。
據貴州省大數據發展管理局相關負責人介紹,部分政府部門在數據收集的過程中,由于缺乏統一的標準,收集到的數據雖然量大,但質量不高,可利用價值低。據此前媒體報道,長江上游地區一些省份的交通管理部門、運輸公司不愿與其他省市共享物流信息,造成聯運銜接的信息壁壘,甚至出現了同樣1噸貨,一百公里公路運費比經濟發達地區高60元的現象。
據了解,截至2016年底,廣東省全省87個省直部門有6988類數據資源、62332項信息項,居全國各省(區、市)首位。但各部門提出的共享需求僅3649類,省級編目共享僅477類,數據難以真正發揮利民惠民、支撐政府決策的作用。
此外,盡管部分數據已接入共享開放平臺,但由于不能被機器讀取,成為無法釋放應有活力的“休眠數據”。《2017中國地方政府數據開放平臺報告》顯示,截至去年4月,全國19個地方政府數據開放平臺的8398個開放數據中仍有約25%的機器可讀性較差。
中國科學院院士、北京大數據研究院院長鄂維南表示, “理論上我國有很多數據,但實際做數據分析會發現利用起來非常困難。”貴陽大數據交易所有關人士透露,不少企業以保護商業機密或節省數據整理成本等為由,不愿意交易自身數據。部分政府部門也缺乏數據公開的動力:有的是因懶政而讓數據沉睡,有的則是已經利用數據開展商業化應用,不愿共享。
其二是技術創新滯后。我國大數據產業雖然與國際大數據發展幾近步伐相同,但是仍然存在技術及應用滯后的差距,在新型計算平臺、分布式計算架構、大數據處理、分析和呈現方面與國外仍存在較大差距,對開源技術和相關生態系統影響力弱。市場上,由于國內大數據企業技術上的不足,用戶更加青睞Google、IBM、Oracle、SAP等國外IT企業。
微軟大中華區董事長兼CEO柯睿杰認為,數據智能并非那么觸手可及。大數據來源眾多、數量巨大、形式各異,要從中獲得一目了然的信息,就需要真正高效、可靠的數據管理和分析平臺。
如何處理巨量數據是中國大數據產業面臨的首要技術問題。鄂維南表示,“中國的數據體量特別大,比如,中國的視頻比任何國家都要多,這些數據儲存困難,需要用的時候往往就沒了”。再以基因測序領域為例,中國每年新增的基因組測序原始數據超過20PB(1PB相當于100萬GB),面臨數據量大、數據處理流程長等技術挑戰。
目前,我國大數據技術創新能力還有待提升。《大數據產業發展規劃(2016-2020年)》指出,我國在新型計算平臺、分布式計算架構、大數據處理、分析和呈現方面與國外仍存在較大差距,對開源技術和相關生態系統影響力弱。同時,大數據應用水平不高。我國發展大數據具有強勁的應用市場優勢,但是目前還存在應用領域不廣泛、應用程度不深、認識不到位等問題。
“我國大數據在底層技術上和國外差距特別大,技術都來源于谷歌等國外大公司。”國務院發展研究中心信息中心研究處處長李廣乾說,很多時候我們的商業模式走在了技術前面,但并沒有通過技術手段來推動創新。
第三是人才不足限制了大數據產業創新發展的成效。清華大學計算機系教授武永衛透露的數據顯示,未來3至5年,中國需要180萬數據人才,但截至目前,中國大數據從業人員只有約30萬人。
同時,大數據行業選才的標準也在不斷變化。初期,大數據人才的需求主要集中在ETL研發、系統架構開發、數據倉庫研究等偏硬件領域,以IT、計算機背景的人才居多。隨著大數據往各垂直領域延伸發展,對統計學、數學專業的人才,數據分析、數據挖掘、人工智能等偏軟件領域的需求加大。
其四,行業應用不深入。賽迪顧問股份有限公司大數據產業研究中心提供的數據顯示,互聯網、金融和電信三大領域的大數據應用在各行業總規模中所占比重超過70%;健康醫療領域和交通領域近年不斷“上架”新應用,但行業規模占比相對較小;而在其他眾多民生領域,大數據應用仍處于淺層次信息化層面,行業發展水平參差不齊。
“目前,大數據在多個行業尚未與業務實現深度融合,應用場景創新不足,大數據技術人員需要提升行業業務知識和經驗。”百分點首席數據科學家杜曉夢表示,國內很多行業仍僅在局部業務上使用大數據技術,僅掌握數據挖掘和分析技術,如不能將技術與業務全面、深度地融合,則無法完全發掘出數據應用的真正價值。
頂層設計牽引產業發展
對于數據開放和共享,工信部賽迪研究院軟件所所長潘文建議,應建立完善大數據發展協調機制,加快政府數據開放共享,穩步推動公共數據資源開放。同時,統籌規劃大數據基礎設施建設,推動制定公共信息資源保護和開放的制度性文件,并加強大數據標準化頂層設計,逐步完善標準體系。
在數據共享方面,貴陽大數據交易所已經做出成功的嘗試。貴陽市政府有關人士表示,若想打通城市現存的信息壁壘,就要讓城市多方資源聯動起來,搭建城市數據共享的平臺,從而激活大數據價值,充分發揮數據資源整合的優質效應,用信息化手段輔助科學決策。
潘文表示,國家層面應支持大數據共性關鍵技術研究,加強海量數據存儲、數據清洗、數據分析發掘、數據可視化等領域關鍵技術攻關,并支持自然語言理解、機器學習、深度學習等人工智能技術創新。
記者注意到,在高端人才稀缺的現實情況下,目前國內企業多選擇從海外和傳統行業挖掘跨界人才,但仍然無法滿足國內市場的大量需求。針對大數據人才供應不足的現象,各種培訓機構和各大高校也開始強化大數據人才的培養。但培養大數據人才需要時間,短期內大數據領域的高端人才仍然會呈現供不應求的狀態。
對于大數據人才建設,多位業內專家表示,應建立適應大數據發展需求的人才培養和評價機制,并建立健全多層次、多類型的大數據人才培養體系。同時,還要完善配套措施,培養大數據領域創新型領軍人才,吸引海外大數據高層次人才來華就業、創業。
去年,教育部公布了第二批獲準開設“數據科學與大數據技術”的高校名單,加上第一批獲批的北京大學、對外經濟貿易大學、中南大學,一共有35所高校獲批開設該專業。今年開始,部分院校將招收第一屆大數據專業本科生。
在行業應用方面,《大數據產業發展規劃(2016—2020)》提出,到2020年,大數據相關產品和服務業務收入突破1萬億元,年均復合增長率保持30%左右,大數據在創新創業、政府管理和民生服務等方面廣泛深入應用。未來如何在搜集、儲存大數據的基礎上更好地整合、分析和應用,將成為優化“數據大腦”的重點課題。
清華大學新聞與傳播學院教授沈陽表示,目前國內的大數據應用側重于數據收集,在基礎統計分析、風險感知和預測方面還有較大提升空間。同時,也不能在尚未明晰具體業務應用場景的情況下盲目追求大數據,而要以應用場景為牽引,只匯集不分析或者片面追求大而全,都不利于大數據發揮其對生產力提升的促進作用。此外,在大數據廣泛運用于創新創業、政府管理和民生服務等方面的同時,也應認識到,大數據對社會的沖擊有多大,社會對于大數據發展的回應、規范和約束就應有多大。
責任編輯:馬麗芳