云計算時代,隨著企業數字化水平的不斷提高,軟件虛擬化和云化使得ICT基礎設施網絡變得越來越復雜和相互依存,在過去幾年中,為了應對數字化轉型給企業帶來的日益增加的系統復雜性,市場上也出現了很多運維分析平臺。
在如今的云計算時代,計算的云化和分布式應用給運維工作帶來了很大的挑戰,讓人海戰術在運維面前失靈,所以基于算法和機器學習的智能運維(AIOps)必將是業務運維場景下的大勢所趨,AIOps平臺利用大數據,現代機器學習和其他高級分析技術,以主動,個性化和動態的見解直接或間接地增強IT操作的功能。
Gartner相關數據指出,全球AIOps平臺市場規模每年在3億美元至5億美元之間,其迅猛發展使得企業引入AIOps工具從而增強IT功能及業務增長成為必然趨勢。
然而,隨著5G等網絡與業務的發展,帶來了高復雜、高質量的運維挑戰。運維能力的演進成為電信網絡能否持續發揮效能的關鍵影響因子,運維智能化轉型已是大勢所趨,而云計算之爭最終也將是無數廠商基于運維的綜合競爭。
華為AIOps:給予運營商需要的“主動性”
當前,電信網絡運維作業面臨問題發現被動、故障根因定位難等一系列問題,各專業運維支撐系統功能也面臨開發周期長,閉環流程自動化程度低的技術瓶頸,運營商無不期望引入AI能力實現智能運維,做到主動維護和故障自愈。
基于10多年來服務行業的經驗,華為不斷打破云管邊端的邊界,來適配千行百業紛繁復雜的需求,加速各行業的數字化轉型,華為AIOps正是是其中最為代表的方案之一。
其實,傳統運維和AIOps是緊密聯系的,并且AIOps也依賴傳統運維的數據基礎、計算處理等,然而,隨著云大量的采用,IT環境越來越復雜,運維管理的任務也越來越繁重,運維自動化可以解決一部分問題,但是一直困擾運維的報警收斂,一些更為靈活的配置需求,依靠運維自動化還不能完全解決,而通過AIOps的方法,則可以更深層次的解決這些問題,并且還可以為IT運維決策提供更智能的依據,預測將要發生的一些趨勢。
具體來看,華為面向業界發布AIOps系列云服務,包括了故障識別根因定位服務、日志異常檢測服務、KPI異常檢測服務,硬盤異常檢測服務等特點,并且支持“開箱即用”,極大限度的“主動性”,使能運營商及企業專網智能化運維的提升,
實際場景中,發現異常或故障之后的定位是運維流程中的難點,目前這些工作主要依賴于專家經驗或手工分析,然而受限于分析算力和知識信息,因此效果并不理想。
NAIE AIOps通過AI算法與業務的融合,準確的將多維度的異常、告警等事件進行匯聚,并拓撲和故障傳播圖等維度的事件匯聚和根因定位,目前已經應用到無線接入網等業務領域,無效上站減少60%,根因識別準確率85%+,運維效率整體提升15%。
在KPI異常檢測上,電信網絡通過KPI預測和監測網絡是最普遍的場景,NAIE AIOps合了電信領域的運維業務特點,提供單指標/多指標檢測、異常原因關聯分析、模 型的自學習調優等關鍵能力,快速識別海量KPI異常情況,也已廣泛應用在電信網絡場景。
在日志異常檢測服務與硬盤異常預測上,NAIE AIOps實現日志的自動分類和統計規律發掘,實時監控出系統的異常行為和相關日志,而當磁盤將寫入極限或面臨故障時,NAIE AIOps可以智能預測14天內的硬盤故障,以采取規避預防措施,以免對業務產生影響。
業務與能力解耦:行業知識與AI技術的“化學反應”
運維工作從早期的人工運維、自動化運維轉變為智能運維,在運維支撐系統的演進方向上,AIOps已經成為電信行業運維智能化轉型的趨勢和共識,在未來五年內,電信行業市場的運維系統和平臺將加速AI能力的升級,成為電信領域AI應用的核心場景,投資占比也將達到60%。
而按照華為對自動駕駛網絡的等級定義,運維的智能化目標是要實現全域、全流程的預測性運維,自動監控、定位、自愈。
從本質來看,網絡運維系統的AIOps能力構建的趨勢是業務與能力解耦,做到AIOps能力的復用、拉通,支持,適配運維場景應用百花齊放和快速上線迭代的需求。
4G改變生活,5G改變社會。無疑,5G的出現驅動行業應用規模商用與千百行業數字化轉型,然而,要發揮5G對經濟高質量發展支撐作用,在這背后,離不開智能運維的“助攻”。
然而,企業要想實現真正的智能化運維,還離不開算法、行業經驗以及高超的工程化水準三大要素。企業級智能運維產品需要方便客戶基于使用場景來調整算法和模型,從而匹配業務需求;此外,還必須具備支撐算法高效率運行的平臺能力,包括大數據處理能力、機器學習平臺能力和流式數據處理能力等。
因此,AIOps要落地,要求相關人才不光要懂大數據和AI技術、還要熟悉運維場景、熟悉業務,企業需要結合行業經驗,平臺工程化以及合適的算法,突破不同的場景應用。
洞察此痛點,華為AIOps使能服務作為自動駕駛網絡AI引擎iMaster NAIE的核心能力,基于NAIE 平臺,提供了一系列的電信領域AIOps原子能力以及組合編排能力,并將各專業運維系統的應用與AI能力解耦,采用分層的服務化架構對接共享數據中心,集中提供AIOps能力,即使沒有足夠的數據與相關的技術能力和人才,也能通過華為AIOps收益,提升智慧運維效率,這也是華為AIOps的核心競爭力。
基于華為電信領域的經驗,原子能力將AI算法與電信領域行業知識融合,預制了默認的電信領域模型參數,同時支持現網運行態的調優,解決當前通用算法模型在具體行業落地效果差的難題。目前,華為AIOps的原子能力庫支持流量預測、故障預測、KPI 異常檢測、日志異常檢測、CHR 異常檢測、異常關聯分、根因定位等超過20項原子能力。
在組合編排與DevOps能力上,通過組合編排功能,使用者可選擇業務場景所需的AIOps原子能力,通過可視化方式完成流程串接,并進行業務泛化參數配置,包括數據接入方式、模型參數、內置電信領域泛化參數、事件通知方式等配置。
此外NAIE的生態服務也提供專業的人員培訓賦能,基于NAIE平臺訓練服務,AIOps的原子能力庫支持使用者根據實際業務需求開展算法模型的創新與開發,不斷擴展AIOps能力。
值得一提的是,在場景組合服務上,華為AIOps可以圍繞運維全流程提供預制典型場景組合應用,快速接入運維流程。
無疑,華為AIOps使能服務作為智能運維AI 能力引擎,融合AI的技術優勢與華為在電信領域的專業優勢,為運維系統的智能化演進提供AIOps 平臺能力支持,助力到各專業運維系統的應用快速上線,讓運維專家專注場景應用設計和業務目標達成。
智能運維“搭橋”邁向5G新基建
隨著“5G 新基建”的加速實施,數字經濟發展迎來新的動能。
從智慧城市到無人工廠、從智慧農業到遠程醫療、從金融科技到車聯網,新基建與各項技術融合而生的場景將無處不在,不僅推動投資消費的快速成長,還將驅動各行業的數字化轉型升級。但隨之而來的是網絡問題復雜化與業務質量高要求的挑戰,運維能力的演進成為電信網絡能否持續發揮效能的關鍵因素。
“欲善新基建,必先利運維”,在ICT平臺的復雜度和集成度將繼續以指數級增長,而人的能力相對保持不變的背景下,運維能力的演進成為電信網絡能否持續發展效能的關鍵影響因子。
盡管在領域或者單點技術上AIOps獲得了一些進展,但AIOps還有很大的空間有待發展,離真正做到無人值守、NoOps還有很大的現實差距。
毋庸置疑,未來的智能運維一定是自洽的,在云原生環境下,基礎架構和系統的部件都將是基于標準化的,運維工作可以完全基于自主、自動、智能決策的業務系統來完成,從而形成閉環。
總的來看,運維在中國仍處于起步階段,然而隨著新基建的不斷加速推進,我國數字化“版圖”也將不斷擴大,屆時AIOps將像“橋梁”一樣去運維數字化系統,加速我們邁向智能社會的腳步。
責任編輯:tzh
-
云計算
+關注
關注
39文章
7852瀏覽量
137683 -
網絡
+關注
關注
14文章
7594瀏覽量
89085 -
電信
+關注
關注
2文章
734瀏覽量
62020 -
5G
+關注
關注
1356文章
48497瀏覽量
565433
發布評論請先 登錄
相關推薦
評論