用數據目錄解決數據蔓延的問題
當數據庫被復制用于企業不同的任務時,大數據成為一個大問題。數據目錄提供了一個強大的的解決方案。
企業的安全分析團隊需要自己的生產數據庫的副本,以便他們可以查找出欺詐性帳戶。企業的應付帳款部門需要一個可以分析的提取物來提高供應鏈效率。企業的銷售經理需要其所有客戶記錄。而企業的數據庫管理員正在使用兩個快照和兩個完整備份來確保所有數據都是安全的。
當數據不必要地重復時,數據蔓延發生
企業所面臨的是一個典型的數據蔓延問題。當組織(無論出于何種原因)創建多個生產數據副本時,廉江會發生這種情況。創建每個副本總有一個很好的理由,但總體來說,它們變得一團糟。
隨著業務用戶越來越希望在大數據的背景下自己分析數據,數據蔓延正成為一個真正的問題。據IDC公司估計,目前多達60%的存儲容量用于復制數據,2018年復制數據存儲的總成本將高達500億美元。但據估計,只有不到20%的組織擁有復制管理標準。調研機構Gartner公司分析師DaveRussell表示,許多公司將會保留30至40份業務數據。
數據蔓延導致組織不同步
除了數據蔓延對基礎設施和性能造成的明顯影響之外,數據完整性成為一個真正的問題。例如,對客戶關系管理(CRM)系統中的客戶記錄進行更新的銷售人員有可能與客戶數據庫中的相同記錄不同步。恢復錯誤備份的數據庫管理員可能會用舊信息覆蓋生產數據。
許多企業正在為復制蔓延問題開發的基于技術的解決方案,其代價高昂,但是對于許多客戶組織來說,最簡單和最具成本效益的方法是以數據目錄為基礎的良好數據治理。
企業數據目錄維護公司擁有的所有數據的單個目錄。這不僅可以包括生產數據,還包括備份、摘錄、摘要。生產數據可以使用獨特的簽名進行“指紋識別”,以便過時的副本不會無意中進入關鍵任務應用程序。同樣,副本和提取可以根據其預期用途進行標記。目錄甚至可以通過確保標記有某些元標記的數據不會被覆蓋來提高數據完整性。
數據目錄加強數據治理策略是解決方案
數據目錄的使用應該與良好的治理實踐相結合。例如,員工需要知道哪些數據可用于分析用途,哪些不應該被觸及,這是副本或新的相關數據。數據庫管理員需要清楚的參數來說明如何恢復備份的數據集。使數據治理既有效又令人愉快的一種方法是鼓勵商業用戶通過眾包的數據質量程序標記自己的數據來加入這個過程。
使用數據目錄減少了數據蔓延的基礎設施損失,減少了孤立數據的發生。它還可以減輕數據庫管理員的負擔,同時提高對業務用戶請求的響應速度。例如,需要客戶記錄的銷售經理可以使用目錄來查找其他部門中已經存在的數據庫,并避免加入積壓的IT作業單。
企業不應該因為內部數據太多而受到影響。其解決辦法不是拒絕具有敏捷性的查看過程的請求,而是為了更好地理解自己擁有哪些數據,以便更加有用。合適的目錄可以提供管理和治理,這是一條可以解決數據蔓延和數據驅動的公司的路徑。
責任編輯:任我行
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
深度報告 | 基于分類監管與當量協同的碳市場框架設計方案
2020-07-21碳市場,碳排放,碳交易 -
碳市場讓重慶能源轉型與經濟發展并進
2020-07-21碳市場,碳排放,重慶
-
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
2020年二季度福建省統調燃煤電廠節能減排信息披露
2020-07-21火電環保,燃煤電廠,超低排放
-
四川“專線供電”身陷違法困境
2019-12-16專線供電 -
我國能源替代規范法律問題研究(上)
2019-10-31能源替代規范法律 -
區域鏈結構對于數據中心有什么影響?這個影響是好是壞呢!