國電東北電力打造安全運維平台

國電東北電力公司為解決運維事件難跟蹤、數據鏈路故障解決慢、運維工作被動、故障無法快速定位等問題,引進勤智運維ITManager係統,實現集中統一的7*24小時的監控,保障關鍵核心業務穩定運轉,提升國電東北電力有限公司運維的核心競爭力。

行業特性

電廠和電網的分離促使電力分工更加精細化、專業化,對專業信息化建設的投入迅速加強。在我國加強電力資源優化調配大背景下,信息化的數據互聯互通、業務協同等方麵的問題日益突出,電力企業的信息化建設開始重視統一化、集成化。

國家電網公司 “SG186”規劃的推出,引領我國電網行業信息化實現快速發展,促進國家電網公司基本完成“縱向貫通、橫向集成”的一體化企業級信息集成平台和適應公司管理需求的八大業務應用的建成,以及規範有效的六個信息化保障體係建立,推動信息化健康、快速、可持續發展。

隨著 SG-ERP 基本建成,電網信息化從高速大規模建設轉入全麵優化提升,更注重集成融合,強化創新驅動,為智能電網提供關鍵技術支撐。國家電網將全麵建成“堅強”骨幹電力通信網,基本建成智能變電站通信網、配網通信網、用電通信網及分布式能源接入通信網,全麵建成 SG-ERP 係統,信息化整體達到國際領先水平,支撐和引領堅強智能電網發展,持續提升績效。

項目背景

隨著國電東北電力公司信息化建設的推進,大量信息係統投入使用,各個電廠間的專線都連接到國電東北電力公司的數據機房中,造成數據機房設備繁多,種類雜。而電力各個業務係統實時性、準確性要求非常高,信息化工作逐步由建設轉向運維、管理和深化應用,信息係統運維服務的安全穩定運維愈發重要。

為解決安全運維需求,響應國網公司的集約化發展策略,實現國電東北電力公司運維業務由“粗放式”向“精益化”,“分散式”向“集約化”的轉變,以及運維體係化、標準化轉型,國電東北電力公司需要建立統一運維體係以滿足電力業務發展需求。

現狀描述及需求分析

國電東北電力有限公司現有機房3個,關鍵網絡設備40多台,關鍵服務器30台,核心業務10餘套,下轄電廠20多個。

經勤智運維團隊深入調研國電東北電力有限公司信息化建設和運維現狀,梳理出國電東北電力有限公司信息化運維需求如下:

(1) 運維事件難跟蹤,各個電廠業務數據鏈路出現問題解決慢。

(2) 設備與業務係統種類多,鏈路複雜。

(3) 出現狀況無法快速定位問題所在位置,無法快速解決故障。

(4) 運維工作被動,出現故障需要現場大量排查,效率低。

解決方案

為此,國電東北電力有限公司量身定製出一套安全運維解決方案,並部署了ITManager係統。部署方案如下:

1、搭建統一的運維管理平台監控平台,監控各地電廠的接入網絡設備和鏈路。

2、通過ITManager的監控功能,監控國電東北電力有限公司的數據機房內的關鍵網絡設備服務器WEB應用和關鍵鏈路等。

3、確保網絡設備及應用係統的7*24小時監控,避免出現運維盲點;同時對出現的故障及時通過運維流程進行派單,並通過短信、郵件等形式告知設備的運維人員。當故障沒有得到及時處理的時候,流程係統將自動升級故障處理級別。


實施方案及部署成果


國電東北電力有限公司大樓.png

國電東北電力辦公大樓

三層網絡設備拓撲圖:

網絡拓撲.png

網絡拓撲

告警界麵.png

告警界麵

方案收益

1、對核心設備和核心業務進行7*24小時的集中統一監控,有效保障國電東北電力有限公司的網絡設備、安全設備、數據庫、服務器、應用係統等高效、穩定的運行,避免了監控盲點。

2、對網絡中關鍵鏈路進行監控,保證國電各電廠間的數據鏈路的健康運行和快速傳輸。

3、定期對監控數據進行報表統計,為信息化建設擴容和整改提供了理論依據和指導意見

4、故障告警通知必達以及快速故障定位,幫助運維人員迅速找到鏈路、服務、網絡和關鍵業務的故障點,快速排查並解決問題。

自勤智的運維監控管理平台ITM上線後,受到了國電東北電力有限公司IT部門負責人和第三方運行維護公司的一致好評。據介紹,從以往被動的工作模式轉變為現在主動的工作模式,對IT部門有很大的幫助。

以往都是其他部門電話打過來運維人員才知道網絡出了問題,工程師再到現場排查,現在當其他部門使用者打電話來時,運維人員已經定位了故障點並且進行了維護,公司上下對IT部門的效率評價很高。第三方運維公司的工程師也表示,有了ITM運維監控平台,他們定位故障點的效率也大大提高,減少了大量人工排查的工作,為快速解決問題提供了有效支撐。

案例亮點

網路設備和服務器設備的監控。國電東北電力有限公司主要監控網絡和業務的連通性的部分,通過網絡設備的上下聯設備的接口進行監控,可以快速定位鏈路中斷的故障點以及業務中斷和運行緩慢時的設備運行狀態,準確的判斷出現故障點的設備接口或者鏈路,以便快速解決。

報表功能。國電東北電力有限公司網絡中心通過ITM運維監控管理平台的自定義報表的數據,對現有設備的進行擴容和調整,合理優化網絡和資源。

 

關於“勤智運維”:作為ITSS副組長單位,“勤智運維”紮根行業、立足用戶、深入場景進行產品創新和研發,規範和引導信息技術服務標準體係建設,十多年來為教育、政府、金融、電力、互聯網、能源、通信、醫療、交通等20多個行業的2000多個企業用戶提供了優質的IT運維方案和服務。

 

OneCenter一體化智能運維服務管理平台,以統一運維為基礎,以Hadoop+Spark大數據分析為核心,提供基礎監控、視頻監控、應用監控分析、雲平台管理、動環監控及可視化3D機房管理、第三方係統平台集成等運維管理方案,是勤智結合國內外ITSS/ITIL/ISO 20000等IT標準和最佳實踐,自主研發的一體化智能運維管理平台。