電力用戶畫像構建方法
電力用戶標簽體系
標簽是人為規定的高度精練的特征標識,電力用戶主要以家庭為單位定義屬性標簽,如:家庭人口數量標簽,3人等;住房區域標簽,金水區等。標簽呈現出兩個重要特征:①語義化,人們能很方便地理解每個標簽含義,這也使得用戶畫像模型具備實際意義,能夠較好地滿足業務需求,如判斷用戶偏好;②短文本,每個標簽通常只表示一種含義,標簽本身無需再做過多文本分析等預處理工作,這為利用機器提取標準化信息提供了便利。
如圖7-2所示,電力用戶標簽體系主要包括兩個類別:一是社會屬性,包括基礎屬性、人口狀況、房屋狀況、熱源類型等,描述了電力用戶的基本類型特征,反映了用戶用電模式和用電需求宏觀差異的原因;二是用電行為,包括負荷模式、用電設施、信用等級、需求響應,描述了電力用戶用電行為基本特征,體現了用戶用電行為的微觀差異,是提供個性化用電服務的基礎。
圖7-2 用戶畫像標簽體系
數據源分析
構建電力用戶畫像是為了還原用戶信息,數據來源于所有用戶相關的數據。對于電力用戶相關數據,采用封閉性的分類方式,有助于后續不斷枚舉并迭代補充遺漏的信息維度,避免架構上對每一層分類沒有考慮完整,造成維度遺漏留下擴展性隱患。
本書將用戶數據劃分為靜態信息數據、動態信息數據兩大類。靜態數據指用戶相對穩定的信息,如圖7-3所示,主要包括:用戶人口、房屋、地域、所屬社區、工業用戶所屬行業、經濟指標等社會屬性信息,反映了用戶的用能類型;熱源、用電器、新能源動力等負荷屬性信息,反映了用戶的用能潛力;購電渠道、信用等級、消費周期等商業屬性,反映了用戶能源消費能力。動態數據指用戶不斷變化的行為信息,主要包括:負荷曲線、負荷控制等用電行為數據,反映了用戶在用電時間、用電量、用電模式等方面的動態信息,有助于實現短期和長期負荷預測,幫助售電主體向用戶推薦優化的用電套餐等;瀏覽、支付于、訂購、發表等互聯網行為數據,反映了用戶在互聯網環境下的用電相關數據,比如用戶通過互聯網瀏覽歷史和當前負荷數據、獲取售電主體的電價和需求響應套餐信息、通過第三方支付繳納電費、訂購合同能源等增值服務、通過互聯網遠程控制家用電器的通斷等。
圖7-3 電力用戶畫像數據源
用戶畫像建模與大數據分析方法
如圖7-4所示,基于大數據的電力用戶畫像分析系統及其建模方法和過程主要包括:
(1)數據源系統。用戶畫像分析系統的數據源主要包括:數據類系統,來自于用電物聯網系統的用電數據、用電器的用電狀態、新能源的設備設施運行參數、智能電網供用電參數等;互聯網渠道系統,主要指用戶通過互聯網平臺進行用電相關行為的靜態和動態數據,包括用戶在售電平臺上的購售電行為數據、支付數據和社交關系數據;第三方數據主要指從政府、行業組織等獲取的公有數據,體現了自然環境、經濟指標和社會發展等內容。
圖7-4 用戶畫像大數據建模分析系統
(2)數據中轉系統。數據中轉系統通過數據交換子系統和外聯應用網關,實現數據文件、日志文件、實時數據及第三方數據集成融合,為大數據分析平臺提供數據輸入。
(3)大數據平臺。基于大數據分析技術,對互聯網用電相關的用戶數據進行預處理、建模分析和可視化。
標簽建模
標簽建模是電力用戶畫像的關鍵環節,如圖7-5所示,目標是根據用戶的屬性和用電行為為其打上標簽,并計算標簽的權重。主要過程包括:
圖7-5 用戶畫像標簽建模方法
(1)數據統計。利用大數據平臺對用戶各種靜態和動態用戶數據進行統計分析,為用戶賦予事實標簽。比如某用戶可以定義標簽為“三之家、普通住宅、12—14點用電高峰、無違約行為”等
(2)建模分析。標簽建模主要涉及靜態標簽和動態標簽,前者為用戶靜態數據形成的標簽,包括用戶社會屬性、經濟環境等;后者為用戶動態數據經過建模分析形成的標簽,包括用戶需求響應潛力、增值服務應用偏好、互聯網行為偏好等。標簽建模的過程,一是建立標簽識別模型;二是計算標簽權重。以用戶互聯網閱讀用電報告的行為為例,用戶畫像的數據模型,可概括為用戶標識+時間+行為類型+接觸點(網址+內容),表示某用戶因為在什么時間什么地點做了什么事,并形成標簽。其中,不同行為類型,對于接觸點的內容產生的標簽信息,具有不同的權重,如瀏覽用電報告時點擊的“電價套餐”和購電時點擊的“電價套餐”具有不同的意義,前者權重定義為1,后者則可以定義為5。用戶標簽的權重可能隨時間的增加而衰減,因此定義權重的衰減因子r,行為類型決定了權重,閱讀內容決定了標簽,進一步標簽權重w可定義為式中:
w=r*wb
式中:wb為行為權重。
通過標簽的建模分析可以為用戶賦予包含標簽的權重的模型標簽,形成用戶興趣愛好、渠道偏好、用電偏好、活躍度、關聯關系、滿意度、信用風向等級等動態標簽。
(3)預測模型。通過對用戶靜態、動態標簽的定義與建模分析,利用數據挖掘和智能算法預測用戶流失概率、近期用電需求、需求響應敏感程度、違約概率等預測性的標簽,支撐能源互聯網各市場主體實現面向用戶的精準消費。
責任編輯:蔣桂云
-
十張圖了解七大國產汽車2017年報看點:新能源汽車布局多
-
談造車:誰能最先量產 誰就是“王者”
2018-04-20最先量產 -
合資股比50%底線背后 我們在擔心什么?
2018-04-20合資股比
-
史上最全最詳細無線通信頻率分配表
2018-04-20無線通信頻率分配表 -
毫米波技術
-
絕對高科技 圍觀神秘的量子通信技術