在當(dāng)今復(fù)雜的業(yè)務(wù)環(huán)境中,IT 團(tuán)隊(duì)面臨著不斷的挑戰(zhàn),從員工賬號(hào)鎖定等簡(jiǎn)單問題到關(guān)鍵的安全威脅,不勝枚舉。針對(duì)這些情況,既需要快速修復(fù),也需要戰(zhàn)略防御,這使得維持平穩(wěn)和安全運(yùn)營(yíng)的工作變得愈發(fā)困難。
而這正是 AIOps 的用武之地。它將人工智能與 IT 運(yùn)營(yíng)相結(jié)合,不僅可以自動(dòng)執(zhí)行日常任務(wù),還能夠增強(qiáng)安全措施。這種方法非常高效,不僅可讓團(tuán)隊(duì)快速處理小問題,而且更重要的是,還能讓團(tuán)隊(duì)比以前更快、更準(zhǔn)確地識(shí)別安全問題并作出響應(yīng)。
借助機(jī)器學(xué)習(xí),AIOps 不僅成為了簡(jiǎn)化操作的重要工具,而且還能全面加強(qiáng)安全性。事實(shí)證明,對(duì)于希望為團(tuán)隊(duì)引入先進(jìn) AI 的企業(yè)來說,AIOps 將成為一個(gè)顛覆性的工具,幫助企業(yè)未雨綢繆,提前為應(yīng)對(duì)潛在安全風(fēng)險(xiǎn)做好準(zhǔn)備。
據(jù) IDC 數(shù)據(jù)顯示,IT 運(yùn)營(yíng)管理軟件市場(chǎng)預(yù)計(jì)將以每年 10.3% 的速度增長(zhǎng);到 2027 年,預(yù)計(jì)收入將達(dá)到 284 億美元。這一增長(zhǎng)凸顯了企業(yè)日益依賴 AIOps 來提升運(yùn)營(yíng)效率,并且它已成為現(xiàn)代網(wǎng)絡(luò)安全戰(zhàn)略的關(guān)鍵組成部分。
隨著機(jī)器學(xué)習(xí)運(yùn)維的快速增多,生成式 AI 時(shí)代不斷發(fā)展。由 NVIDIA 合作伙伴組成的廣泛生態(tài)系統(tǒng)正在提供 AIOps 解決方案,利用 NVIDIA AI 幫助企業(yè)改進(jìn) IT 運(yùn)營(yíng)。
NVIDIA 致力于通過加速計(jì)算和 AI 軟件,為廣泛的 AIOps 合作伙伴生態(tài)系統(tǒng)提供幫助。其中包括 NVIDIA AI Enterprise,這是一個(gè)可以在任何地方運(yùn)行的云原生堆棧,并通過 NVIDIA NIM(用于加快 AI 模型推理)、NVIDIA Morpheus(用于基于 AI 的網(wǎng)絡(luò)安全)和 NVIDIA NeMo(用于自定義生成式 AI)等軟件,為實(shí)現(xiàn) AIOps 奠定堅(jiān)實(shí)的基礎(chǔ)。該軟件有助于實(shí)現(xiàn)基于生成式 AI 的聊天機(jī)器人、摘要和搜索功能。
使用 NVIDIA AI 的 AIOps 服務(wù)提供商包括:
Dynatrace Davis 超模態(tài) AI 集成了因果 AI、預(yù)測(cè)式 AI 和生成式 AI 技術(shù),并采用 Davis CoPilot,以強(qiáng)化 AIOps。這一組合能夠提供精確、切實(shí)可行且由 AI 驅(qū)動(dòng)的回答和自動(dòng)化,有助于增強(qiáng) IT、開發(fā)、安全和業(yè)務(wù)運(yùn)營(yíng)的可觀察性和安全性。
Elastic 提供用于語義和向量搜索的 Elasticsearch Relevance Engine (ESRE),該引擎集成了 GPT-4 等熱門 LLM,能夠?yàn)榭捎^察性和安全性解決方案中的 AI 助手提供強(qiáng)大的支持。Observability AI Assistant 是新一代 AIOps 功能,可協(xié)助 IT 團(tuán)隊(duì)了解復(fù)雜系統(tǒng)、監(jiān)控運(yùn)行狀況,并自動(dòng)修復(fù)運(yùn)營(yíng)問題。
New Relic 正在利用其機(jī)器學(xué)習(xí)、生成式 AI 助手框架以及長(zhǎng)期以來在可觀察性方面積累的專業(yè)知識(shí)來強(qiáng)化 AIOps。它的機(jī)器學(xué)習(xí)和高級(jí)邏輯可幫助 IT 團(tuán)隊(duì)減少警報(bào)噪音、縮短平均檢測(cè)時(shí)間和平均修復(fù)時(shí)間、自動(dòng)分析根本原因并生成回顧。它的生成式 AI 助手 New Relic AI 可加快問題解決速度,用戶無需切換上下文,即可識(shí)別、解釋和解決錯(cuò)誤。它能夠直接在開發(fā)者的集成開發(fā)環(huán)境中提供代碼修復(fù)建議并修復(fù)代碼。此外,它還能自動(dòng)生成高級(jí)系統(tǒng)運(yùn)行狀況報(bào)告、分析和匯總儀表盤以及回答有關(guān)用戶應(yīng)用、基礎(chǔ)設(shè)施和服務(wù)的簡(jiǎn)單語言問題,將事件可見性和預(yù)防擴(kuò)展到非技術(shù)團(tuán)隊(duì)。對(duì)于受益于 NVIDIA GPU 的 AI 驅(qū)動(dòng)的應(yīng)用,New Relic 還能實(shí)現(xiàn)全棧可觀察性。
PagerDuty 在 PagerDuty Copilot 中新增一項(xiàng)功能,即在 Slack 中集成了生成式 AI 助手,以便在從事件發(fā)生到解決的整個(gè)過程中提供深入洞察,簡(jiǎn)化事件生命周期,并減少 IT 團(tuán)隊(duì)的人工任務(wù)量。
ServiceNow 致力于創(chuàng)建主動(dòng) IT 運(yùn)維, 包括自動(dòng)產(chǎn)出洞察(以對(duì)事件作出快速響應(yīng))、優(yōu)化服務(wù)管理和檢測(cè)異常。現(xiàn)在,該公司正在與 NVIDIA 合作推進(jìn)生成式 AI 的發(fā)展,進(jìn)一步推動(dòng)技術(shù)服務(wù)和運(yùn)營(yíng)的創(chuàng)新。
Splunk 的技術(shù)平臺(tái)依托人工智能和機(jī)器學(xué)習(xí),針對(duì)實(shí)現(xiàn)運(yùn)營(yíng)問題與威脅,實(shí)現(xiàn)了識(shí)別、診斷和解決流程的自動(dòng)化,進(jìn)而提高 IT 效率,并改善安全狀況。Splunk IT Service Intelligence 是 Splunk 的主要 AIOps 產(chǎn)品,能夠從一個(gè)位置提供由嵌入式 AI 驅(qū)動(dòng)的事件預(yù)測(cè)、檢測(cè)和解決方案。
亞馬遜云科技 (AWS)、谷歌云和 Microsoft Azure 等云服務(wù)提供商為企業(yè)和組織靈活地提供大規(guī)模云資源,幫助其實(shí)現(xiàn) IT 運(yùn)營(yíng)的自動(dòng)化和優(yōu)化。
亞馬遜云科技提供了一套有助于 AIOps 的服務(wù),包括用于監(jiān)控和可觀察性的 Amazon CloudWatch、用于跟蹤用戶活動(dòng)和 API 使用情況的 AWS CloudTrail、用于創(chuàng)建可重復(fù)且負(fù)責(zé)任的機(jī)器學(xué)習(xí)工作流的 Amazon SageMaker 和用于無服務(wù)器計(jì)算、可基于觸發(fā)器自動(dòng)執(zhí)行響應(yīng)操作的 AWS Lambda。
谷歌云通過 Google Cloud Operations 等服務(wù)為 AIOps 提供支持,該服務(wù)可為云端和本地的應(yīng)用提供監(jiān)控、日志記錄和診斷功能。谷歌云的 AI 和機(jī)器學(xué)習(xí)產(chǎn)品包括 Vertex AI(用于模型訓(xùn)練和預(yù)測(cè))和 BigQuery(利用 Google 基礎(chǔ)設(shè)施的處理能力進(jìn)行快速 SQL 查詢)。
Microsoft Azure 通過 Azure Monitor 來全面監(jiān)控應(yīng)用、服務(wù)和基礎(chǔ)設(shè)施,推動(dòng) AIOps 發(fā)展。Azure Monitor 的內(nèi)置 AIOps 功能有助于預(yù)測(cè)容量使用情況,實(shí)現(xiàn)自動(dòng)擴(kuò)展,識(shí)別應(yīng)用性能問題,以及檢測(cè)虛擬機(jī)、容器和其他資源中的異常行為。Microsoft Azure 機(jī)器學(xué)習(xí)(AzureML)提供了一個(gè)基于云的 MLOps 環(huán)境,可安全、負(fù)責(zé)任地大規(guī)模訓(xùn)練、部署和管理機(jī)器學(xué)習(xí)模型。
專注于 MLOps 的平臺(tái)主要致力于簡(jiǎn)化機(jī)器學(xué)習(xí)模型的生命周期(從開發(fā)到部署和監(jiān)控)。下列公司雖然核心任務(wù)在于讓機(jī)器學(xué)習(xí)變得更易于獲取、更高效和更具可擴(kuò)展性,但鑒于其技術(shù)和方法增強(qiáng)了 IT 運(yùn)營(yíng)中的 AI 功能,因此也間接實(shí)現(xiàn)了對(duì) AIOps 的支持:
Anyscale 的平臺(tái)基于 Ray,可以輕松擴(kuò)展 AI 和機(jī)器學(xué)習(xí)應(yīng)用,包括 AIOps 中用于異常檢測(cè)和自動(dòng)修復(fù)等任務(wù)的應(yīng)用。Anyscale 通過促進(jìn)分布式計(jì)算,幫助 AIOps 系統(tǒng)更高效地處理大量運(yùn)營(yíng)數(shù)據(jù),實(shí)現(xiàn)實(shí)時(shí)分析和決策。
Dataiku 可用于創(chuàng)建預(yù)測(cè) IT 系統(tǒng)故障或優(yōu)化資源分配的模型,IT 團(tuán)隊(duì)借助它,可在生產(chǎn)環(huán)境中快速部署和迭代這些模型。
Dataloop 的平臺(tái)提供完整的數(shù)據(jù)生命周期管理功能,并能夠靈活地為端到端工作流引入 AI 模型,使用戶能夠使用自身數(shù)據(jù)開發(fā) AI 應(yīng)用。
DataRobot 是一個(gè)完整的 AI 生命周期平臺(tái),可幫助 IT 運(yùn)營(yíng)團(tuán)隊(duì)快速構(gòu)建、部署和管理 AI 解決方案,提高運(yùn)營(yíng)效率和性能。
Domino Data Lab 的平臺(tái)使企業(yè)及其數(shù)據(jù)科學(xué)家在統(tǒng)一的端到端平臺(tái)上構(gòu)建、部署和管理 AI。所有環(huán)境中的數(shù)據(jù)、工具、計(jì)算、模型和項(xiàng)目都是集中管理的,因此團(tuán)隊(duì)可以彼此協(xié)作、監(jiān)控生產(chǎn)模型,并實(shí)現(xiàn)受治理的 AI 創(chuàng)新最佳實(shí)踐標(biāo)準(zhǔn)化。這種方法對(duì)于 AIOps 至關(guān)重要,因?yàn)樗饶軡M足數(shù)據(jù)科學(xué)團(tuán)隊(duì)對(duì)自助服務(wù)的需求,又能滿足 IT 運(yùn)營(yíng)所需的完全可復(fù)現(xiàn)性、精細(xì)的成本跟蹤和對(duì) AI 的主動(dòng)治理。
Weights & Biases 提供用于實(shí)驗(yàn)跟蹤、模型優(yōu)化和協(xié)作的工具,這對(duì)于開發(fā)和微調(diào) AIOps 中使用的 AI 模型至關(guān)重要。Weights & Biases 還提供有關(guān)模型性能的詳細(xì)洞察,并促進(jìn)團(tuán)隊(duì)間的協(xié)作,這有助于確保為 IT 運(yùn)營(yíng)部署有效且透明的 AI 模型。
審核編輯:劉清
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5025瀏覽量
103266 -
人工智能
+關(guān)注
關(guān)注
1792文章
47442瀏覽量
238996 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8425瀏覽量
132773 -
聊天機(jī)器人
+關(guān)注
關(guān)注
0文章
339瀏覽量
12334
原文標(biāo)題:GTC24 | 設(shè)計(jì)安全:NVIDIA AIOps 合作伙伴生態(tài)系統(tǒng)為企業(yè)帶來 AI 加持
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論