研究:智能電網大數據平臺及其關鍵技術
智能電網是大數據的重要技術應用領域之一。智能電網大數據結構復雜、種類繁多,具有分散性、多樣性和復雜性等特征,這些特征給大數據處理帶來極大的挑戰。智能電網大數據平臺是大數據挖掘的基礎,通過智能電網大數據平臺可實現智能電網全數據共享,為業務應用開發和運行提供支撐。
引言
智能電網是以物理電網為基礎,將現代先進的傳感測量技術、通信技術、信息技術、計算機技術和控制技術與物理電網高度集成而形成的新型電網,見圖1。它涵蓋發電、輸電、變電、配電、用電和調度等各個環節,對電力市場中各利益方的需求和功能進行協調,在保證系統各部分高效運行、降低運營成本和環境影響的同時,盡可能提高系統的可靠性、自愈性和穩定性。隨著智能電網的發展,電網在電力系統運行、設備狀態監測、用電信息采集、營銷業務系統等各個方面產生和沉淀了大量數據,充分挖掘這些數據的價值具有重要的意義。
大數據是近年來受到廣泛關注的新概念,一般是指無法在可容忍的時間內用傳統的IT技術、軟硬件工具和數學分析方法,對其進行感知、獲取、管理、處理和分析的數據集合。智能電網被看作是大數據應用的重要技術領域之一。目前許多學者正在進行智能電網大數據研究,包括發展戰略研究、大數據技術研究、應用研究等。
智能電網大數據應用眾多,涉及電網安全穩定運行、節能經濟調度、供電可靠性、經濟社會發展分析等諸多方面,進行智能電網大數據分析需要統一智能電網大數據,并且由于應用眾多,對計算、存儲、網絡等性能提出了較高要求,因此需要構建面向智能電網應用的統一大數據處理平臺。本文首先分析智能電網大數據特點以及業務應用需求,接著結合業務應用介紹大數據關鍵技術,進而提出智能電網大數據平臺和應用框架。
1、智能電網大數據概述
1.1智能電網大數據特點
根據數據來源的不同,可以將智能電網大數據分為電力企業內部數據和電力企業外部數據。電力企業內部數據源主要包括廣域量測系統(WAMS)、數據采集與監控系統(SCADA)、在線監測系統、用電信息采集系統、生產管理系統、能量管理系統、配電管理系統、客戶服務系統、財務管理系統等;電力企業外部數據源包括氣象信息系統、地理信息系統、互聯網數據、公共服務部門數據、社會經濟數據等。這些數據分散放置在不同地方,由不同單位/部門管理,具有分散放置、分布管理的特性。
智能電網大數據結構復雜、種類繁多,除傳統的結構化數據外,還包含大量的半結構化、非結構化數據,如客戶服務中心信息系統的語音數據,設備在線監測系統中的視頻數據與圖像數據等。這些數據的采樣頻率與生命周期也各不同,從微秒級、分鐘級、小時級,一直到年度級。
1.2大數據業務需求分析
智能電網大數據業務應用根據對象不同可分為面向電力公司運行管理、面向電力用戶服務、面向政府部門輔助決策等3類。面向電力公司運行管理類應用包括電力系統穩定性分析與控制、輸變電設備故障診斷與狀態檢修、配電網運行狀態評估與預警、配電網故障定位、負荷預測、城市電網規劃等;面向電力用戶服務類應用包括用戶用電行為分析、需求側管理、能效分析、供電服務輿情分析等;面向政府部門輔助決策類應用包括社會經濟狀況分析與預測、政府決策支持與相關政策評估,如電價政策、新能源補貼政策等是否合理等。這些需求需要綜合電網運行狀態信息、用戶用電信息、客服系統信息、氣象數據、經濟社會數據和互聯網數據等。
2、智能電網大數據關鍵技術
根據信息處理流程,大數據在智能電網中的應用可以分為數據采集、數據清理、數據存儲及處理、數據分析、數據解讀和數據應用6個環節,其關鍵技術包括數據集成技術、數據存儲技術、數據處理技術和數據分析技術。
2.1數據集成技術
智能電網大數據具有分散性、多樣性和復雜性等特征,這些特征給大數據處理帶來極大的挑戰。要想處理智能電網大數據,首先就需要對眾多數據源的數據進行集成,通過數據抽取、轉換、剔除、修正等處理,建立正確、完整、一致、完備、有效的智能電網大數據。目前通常采用的數據集成模型包括數據聯邦、基于中間件模型和數據倉庫等。
ETL是企業數據集成的主要解決方案。ETL指Extract、Transform、Load,即抽取、轉換、加載。數據抽取是從源數據源系統抽取目的數據源系統需要的數據;數據轉換是將從源數據源獲取的數據按照業務需求,轉換成目的數據源要求的形式,并對錯誤、不一致的數據進行清洗和加工;數據加載是將轉換后的數據加載到目的數據源。ETL過程中的主要環節就是數據抽取、數據轉換和加工、數據加載。為了實現這些功能,各個ETL工具一般會進行一些功能上的擴充,例如工作流、調度引擎、規則引擎、腳本支持、統計信息等。
數據集成是智能電網大數據應用的關鍵環節。智能電網大數據集成涉及眾多各類型的應用系統,這些系統類型和特征復雜,在實時性要求、數據規模、數據類型等方面存在較大的差異,在智能電網大數據集成中需要綜合考慮各種因素,在集成技術上單一技術可能很難實現,需要結合多種技術來實現智能電網大數據的集成。
2.2數據存儲技術
在智能電網大數據中,絕大多數數據為結構化數據,同時也存在文本、圖像、音頻、視頻等非結構化或半結構化數據。對非結構化數據可采用分布式文件系統進行存儲,對結構松散無模式的半結構化數據可采用分布式數據庫,對海量的結構化數據可采用傳統關系型數據庫系統或分布式并行數據庫。
2.2.1 分布式文件系統
分布式文件系統適合存儲海量的非結構化數據,將數據存儲在物理上分散的多個存儲節點上,對這些節點的資源進行統一管理和分配,并向用戶提供文件系統訪問接口,主要解決本地文件系統在文件大小、文件數量、打開文件數等方面的限制問題。
Hadoop是大數據的一個解決方案,可以實現大數據的存儲、分析和管理[9]。HDFS (Hadoop Distributed File System)是一個分布式文件系統,它是開源項目Hadoop的家族成員。HDFS將大規模數據分割為大小為64兆字節的數據塊,存儲在多個數據節點組成的分布式集群中,當數據規模增加時,只需要在集群中增加更多的數據節點,具有很強的可擴展性;同時每個數據塊會在不同的節點中存儲多個副本,具有高容錯性;由于數據是分布存儲的,具有高吞吐量的數據訪問能力。
2.2.2 分布式數據庫
大數據環境下對數據的存儲、管理、查詢和分析需要采用新的技術,傳統的數據庫在數據存儲規模、吞吐量、以及數據類型和支撐應用等存在瓶頸。分布式數據庫由于具有很好的擴展性和協同性,在大規模數據存儲和管理中得到廣泛的應用。目前主要有鍵值存儲系統、文檔數據庫、圖數據庫等。
Hbase是一個高可靠性、高性能、面向列、可伸縮的分布式存儲系統,它不同于一般的有模式的關系型數據庫,Hbase存儲的數據表是無模式的,特別適合結構復雜多樣的半結構化數據存儲。Hbase利用HDFS作為其文件存儲系統,可利用Map-Reduce技術來處理Hbase中的海量數據。
2.2.3 關系型數據庫系統
智能電網中很大一部分數據是結構化數據,針對一些數據和業務應用,傳統關系型數據庫可能更適合,因此在大數據環境下,傳統關系型數據庫也具有一定的應用。基于傳統數據庫如Oracle等構建數據倉庫,開展智能電網業務的分析挖掘。
智能電網大數據結構復雜、種類繁多,其數據存儲需要根據數據的特點選用適合的數據存儲方式。數據管理也是智能電網大數據的重要功能,從整體上對存儲在不同系統上的數據進行統一管理,并提供數據索引和查詢功能。
責任編輯:電朵云
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市