“智慧城市”大數據時空融合密碼
國家發改委和中央信息辦在智慧城市建設規劃中,將“時空基礎設施”建設的組織任務分配給(原)國家測繪地理信息局,很多城市啟動了“智慧城市時空大數據與云平臺”項目。
在《智慧城市時空大數據與云平臺建設技術大綱(2017版)》中,明確:“時空基礎設施作為智慧城市的重要組成,既是智慧城市不可或缺的、基礎性的信息資源,又是其他信息交換共享與協同應用的載體,為其他信息在三維空間和時間交織構成的四維環境中提供時空基礎,實現基于統一時空基礎下的規劃、布局、分析和決策。”
對以上目標,筆者完全認同。同時,筆者認為——在“信息資源提供”和成為“交換共享與協同應用的載體”兩者之中,后者更為重要,時空作為數據融合共享的載體是天然的。我們一起剝絲抽繭,討論一下時空大數據在智慧城市中的應用模式。
01.支撐時空決策,是時空大數據的存在價值
關于“大數據”的描述,筆者認同Teradata首席分析專家Bill Franks在《駕馭大數據》中表達的觀點:沒有一種數據叫做“大數據”,“大”和“數據”都不重要,使用數據的方法才重要。我們無需爭論哪些數據屬于大數據和時空大數據,所有的數據都在時空中,也都是大數據,只要用大數據的方法去使用。
收集和使用數據的方法取決于需要解決的問題,我們把工作任務分為兩類,一類是事務性任務,需要精確采集、記錄事實信息和處置過程,比如土地所有權發證、工程測量、辦理銀行存款、電子商務交易;一類是決策類任務,例如土地規劃、應急指揮、營銷策略制定等,需要收集多維度數據進行綜合分析。
大數據的應用目標是支持決策類任務,而非事務性工作。事務性工作是數據產生的源頭,其積累的數據成果,經過抽取、融合后方可成為支撐大數據分析的輸入。大數據分析不必、也不能直接面向原始業務數據。
順便說一下大數據和云平臺的關系。云平臺的本質是計算資源和存儲資源的虛擬化,是大數據實施的適宜支撐環境,但非必須。云平臺能力并不等同于大數據能力,兩者的關系類似于“結婚和買房”。
02.數據融合,是時空大數據的核心能力
智慧城市首先強調數據共享,各地紛紛成立“大數據局”匯集數據,此舉就可以消除“信息孤島”了嗎?一位資深地方信息中心主任半開玩笑地說:以前是“煙囪式”的數據調用,現在將一堆煙囪捆在一起集中排放,污染更加嚴重。
數據如果無法融合,共享便失去意義。
數據融合有兩種,一種是以人為線索。比如,將一個人在公安、社保、工商、稅務等多個部門的數據打通,實現信息互通。這是辦公流程的優化,事務性工作的效率提升,嚴格講不屬于大數據的范疇。在商業大數據領域,通過人的行為數據進行“客戶畫像”,制定個性化的營銷策略,應屬于大數據應用范疇。
另外一種融合,便是時空融合,目的是支撐城市管理者的時空決策,例如:土地規劃、產業布局規劃、交通治理、環境治理、應急指揮等等,基本邏輯是“何時、何地、何為”。時間和空間即是所有數據的共同特征,又是所有智能的基礎,基于時空的數據融合是必然途徑。
數據融合需要線索,在商業大數據中,圍繞著“人”為線索形成“客戶畫像”;在時空大數據中,需要定義“地理實體”進行數據融合,形成“地理畫像”。
03.基于“地理實體”的數據融合
在《智慧城市時空大數據與云平臺建設技術大綱(2017版)》中,明確要求建設“地理實體”數據:以地形圖為基礎,對境界、政區、道路、水系、院落、建筑物、植被等內容進行實體化,并賦予唯一編碼,作為與其它行業和專題數據進行關聯的基礎。
地理實體是占據一定空間的地物或者現象,地理實體定義及編碼的目標是“通過編碼交換空間信息”,交換的內容是指附著在空間上的屬性信息,例如土地性質、人口統計、經濟指標等等。實施的關鍵是:建立編碼與空間范圍的對應關系并使之成為統一標準,例如全國統一的郵政編碼和行政區劃。
編碼是溝通效率最高、不易產生歧義且管理效率最高的手段,比如身份證號、樓棟號、學籍號、地類代碼等。用編碼代表空間范圍也是一種常用手段,如標準圖幅號、投影帶號、電話區號等。
用地理編碼作為數據的空間關聯線索,可以避免多尺度、多投影、多格式地圖數據整合所帶來的繁瑣工作。
但是,空間單元本質上是業務管理單元,每個部門都有各自的單元劃分和編碼標準,并在業務運行和信息系統建設中貫徹執行。郵政部門劃定郵政編碼、教育部門劃定學區、交通部門劃定道路分段、國土部門劃定地塊、城管部門劃定城管網格、公安部門劃定片警轄區……。
不同領域的空間業務單元劃分差異性很大,互不相容,不可能設計出一套適合所有行業的劃分規則;即使存在完美方案也難以推廣,會涉及業務規則調整和信息系統重建,統一的、唯一的編碼無從談起,將編碼作為數據關聯線索也就無法落實。
在“大數據局”模式下,各部門提交原始業務數據,必會由數據規格多樣而帶來數據融合困境,“煙囪”依舊;而制定一個統一空間標準,強制推廣到各個部門,業務規則沖突必然導致障礙重重;只有在所有業務的底層,設計一個共同的融合架構,才可能從根本上解決數據融合的問題。
04.基于空間網格的地理實體定義和編碼方法
有沒有一種方法,既不改動各領域的業務單元劃分,又能夠實現“通過編碼交換空間信息”的目標呢?
答案就是基于空間網格的地理實體定義和編碼方法。第一步,設計一套全域覆蓋的多級基礎空間網格,并賦予唯一編碼。設定最小網格尺寸,按四叉樹逐級向上合并生成上一級網格,網格編碼作為網格在計算機中的存儲形態。
第二步,用網格集合定義地理實體,網格集合編碼作為地理實體編碼。不同行業,不同尺度的地理實體,選擇不同層次的網格集合來定義。例如:用1米網格記錄建筑物信息,用2米網格記錄土地利用現狀,用100米網格記錄人口數量,用1公里網格記錄空氣質量,用5公里網格記錄氣象信息。
地理實體編碼由所覆蓋“基礎網格編碼”組合生成,最完整的編碼是把所有覆蓋網格的編碼連接在一起,也可進行編碼壓縮避免過長。這樣,解析編碼即可獲得地理對象的組成網格,進而獲得地理實體的覆蓋范圍。如下圖示意,可根據需要的空間精度選擇合適層次的網格,網格越小,編碼越長,也越接近原始精度。
事實上,在大數據應用中,并不需要原始精度的業務數據,也不需要原始數據的完整內容,而是根據應用分析和決策支持的需要進行抽取和簡化,而空間網格是空間簡化的適宜方式。如果需要原始數據,通過網格索引調用即可。
由于編碼只與地理實體的覆蓋網格有關,而與業務內容無關,此編碼可自動生成;同一領域的業務單元劃分在空間上不重疊,編碼的唯一性可以保證;當某一領域的空間業務單元調整時,數據共享融合系統無需改動。
如用戶的數據為GIS數據,解析圖形即可獲得編碼;如用戶數據為表格數據,解析其中地名地址信息即可生成編碼,只需提前生成標準的地名地址網格編碼;對于智能感知數據,也可選擇合適的網格級別進行空間化標定。
通過一個輕量化的數據抽取工具,對接到不同行業的業務系統中,即可以自動生成形式為“地理實體編碼+屬性數據”交換數據,由于所有地理實體基于相同的基礎空間網格生成,基礎網格是不同地理實體溝通的橋梁,各種空間分析可利用“編碼計算”完成,利用地理編碼進行多源異構數據的共享、交換、協同和融合得以實現。
05.基礎時空框架與時空網格數據倉庫
在李德仁院士的論文《從數字地圖到空間信息網格——空間信息多級網格理論思考》(2003)中,明確指出:“空間數據種類繁多、數據格式各異、存在多種比例尺、多種空間參考系和多種投影類型。這給需要使用空間數據的用戶帶來了很大的困難,不利于空間信息的共享。究其原因,主要在于GIS是面向空間數據,特別是地圖數據的,而不是直接面向空間信息的。” 空間信息網格使空間應用直接面向空間信息,走出地圖的束縛。
智慧城市時空大數據平臺需要建立基礎空間網格,作為空間基礎設施;將連續的時間離散化,形成多尺度基礎時間網格,是以時間為線索進行數據檢索和融合的基礎框架;還需建立標準的地名地址網格對象,是地名地址空間范圍的網格表達,是基于基礎空間網格的公共網格集合。“基礎時空網格+地名地址網格對象”組成了智慧城市“基礎時空框架”,是大數據時空融合的底層支撐。
基礎時空框架與具體數據無關,網格劃分是靜態的,不會因城市擴張、行政區劃合并、撤消、分割等情況而改變,不同時間的信息網格具有空間可比性,可方便地進行時序分析。同時,各種量化的統計指標都基于共同的基礎時空框架,也便于不同行業的統計數據進行時空對比分析。
從不同行業數據庫中抽取出來的網格數據匯集到一起,形成了“時空網格數據倉庫”。數據倉庫是面向決策過程的、面向主題的、集成的、穩定的、不同時間的時空網格數據集合,是實現時空決策分析的數據基礎和支撐環境。在數據倉庫之上,構建若干時空決策分析服務,形成支撐智慧城市時空大數據決策支持分析的完整架構。
在基礎時空框架的支撐下,時空大數據平臺可提供基于網格的公用基礎數據資源;各行業之間在框架內基于網格交換信息;更重要的是,有共同基因的網格數據匯聚到一起后,智慧城市的各項時空決策得以高效務實地進行。
總結
智慧城市時空大數據與云平臺建設中,數據類型和數據范圍擴展以及運行環境的云平臺升級,僅完成了“基礎信息資源提供”的目標,而利用時空網格體系構建基礎時空框架和數據倉庫,突破數據融合瓶頸,才能成為“交換共享與協同應用的載體”,實現“基于統一時空基礎下的規劃、布局、分析和決策”,才能稱得上智慧城市的“時空基礎設施”。
責任編輯:電改觀察員
-
5大重點任務11個重點細分 河北加快構建省級能源大數據中心
-
能源互聯網注入數字經濟新動能 電力大數據實現更多價值
2020-07-21能源互聯網,電力大數據,電力企業 -
中國首個100%利用清潔能源運營的大數據產業園投運
2020-07-21清潔能源,清潔能源消納,青海
-
探索大數據 區塊鏈實現與能源互聯網良好契合
2020-06-09區塊鏈,電力行業,能源互聯網 -
基于區塊鏈的含安全約束分布式電力交易方法
-
區塊鏈在能源交易與協同調度的應用前景:提升電力交易的自由度和實時響應效率
2019-11-04區塊鏈在能源交易與協同
-
5大重點任務11個重點細分 河北加快構建省級能源大數據中心
-
中國首個100%利用清潔能源運營的大數據產業園投運
2020-07-21清潔能源,清潔能源消納,青海 -
大數據產業園四處開花
2019-03-05大數據產業園
-
能源互聯網注入數字經濟新動能 電力大數據實現更多價值
2020-07-21能源互聯網,電力大數據,電力企業 -
全國人大代表、貴州六盤水市市長李剛:借力大數據綜合試驗區 建設六盤水5G示范城
2020-05-27大數據,5G,電力,六盤水,物聯網 -
融媒體平臺建設及縣域融媒體平臺軟件系統
2019-04-03融媒體平臺