基于人工智能的存儲使企業能夠快速智能地分析數據,幾乎即時提供洞察力。
如果將存儲想像成自動駕駛汽車而不是勞動密集型的必需品,該怎么辦?如果像自動駕駛汽車一樣可以預測途中遇到的障礙,企業的存儲基礎設施是否可以預測其需求?
企業可以根據對新技術的承受能力和企業文化,可能已經在利用從應用程序的行為中學習,識別應用程序和配置中的異常,并使用該信息預測和預防問題的技術。
這些功能的核心技術是人工智能。事實上,人工智能的全面應用還需要一段時間,專家認為這不可能很快改變。麥肯錫公司最近的一項調查發現,如今將近一半的公司正在以某種方式使用人工智能技術,絕大多數公司預計,未來幾年他們在人工智能方面的投資將增加。
當要滿足當今的存儲需求時,人工智能正變得至關重要。它使大量的數據能夠被快速智能地分析,并有助于避免瓶頸、可用性問題和安全問題?;谌斯ぶ悄艿拇鎯κ笽T人員可以將更少的時間花費在安全問題上,并提高基礎一言堂的可用性和生產力。
HPEStorage公司產品營銷總監David Wang表示,其目標是創建一個自主的、由人工智能驅動的幾乎可以即時提供洞察的基礎設施。
他說:“我們希望找到一個洞察力可以推動立即變化的地方。這是從內部部署、邊緣計算一直到云計算的端到端人工智能管道的爭論?!?/p>
從不同的角度看待問題
IBM公司存儲市場營銷總監Doug O‘Flaherty說,人工智能改變了存儲的任務,這意味著組織應該以不同的方式看待存儲和數據。
他說:“必須停止將存儲視為數據庫或特定用例所需的東西,并考慮如何以不同的方式使用對不同部門數據的訪問。如果企業可以讓數據科學家或組織中負責跨部門工作的其他人員訪問這些數據,那么就可以進入下一層數據分析,這實際上改變了存儲的主要任務之一?!?/p>
除了進行更廣泛的思考之外,重要的是人工智能改變了存儲的任務,而不是傳統的以數據為中心的存儲方式。
專注于分布式NoSQL數據庫技術的Splice Machine公司首席執行官Monte Zweben解釋說,“在這個大數據人工智能世界的1.0版本中,企業認為它們必須由數據驅動。因此,他們專注于將所有數據存儲在存儲庫中以及該組中的所有人工智能工作人員?!?/p>
他說,這樣做的結果是,這些數據池往往很快就變成了“數據沼澤”,主要是因為負責業務流程的人能夠最好地使用這些數據,以及在這些業務流程中使用的應用程序被排除在外。
通過專注于應用程序而不是數據,企業將能夠更好地將存儲及其功能與業務相匹配。例如,處理大量索賠(業務流程)的保險公司將與負責索賠系統的專家和應用程序開發人員一起識別應用程序。通過將它們放在一起,他們可以最好地決定如何使用數據來創建智能的索賠處理系統。
他說:“這是使應用程序具有數據智能化,而不是試圖收集所有數據,并將其提供給可能對索賠感興趣的人。這是一個簡單的想法,但它可以對企業如何操作人工智能產生深遠影響?!?/p>
構建一個成功的基于人工智能的存儲基礎設施還意味著解決人工智能存儲管道中三個不同階段中的每一個階段:數據攝?。◤牟煌h境攝取和規范化數據,以便可以將其作為一個整體來看待),訓練(使用機器學習來檢查數據以了解其中的真正含義)和推理(提供見解的階段)。
為了滿足這些要求,存儲基礎設施必須能夠支持非常高的容量、長期數據保留和高性能處理。換句話說,大規模的人工智能需要規模、保留和性能方面的能力。
Storage Switzerland公司首席分析師George Crump說,支持非常高的存儲容量的能力至關重要。他說,由于獲得人工智能的初始成本,組織很少刪除用于訓練人工智能工作負載的數據點。此外,這些數據集不遵循隨著使用時間的增長而減少使用機會的典型數據訪問模型。他補充說:“人工智能工作負載需要重新處理原始訓練數據的可能性幾乎為100%,因此整個數據集需要保持隨時可訪問?!?/p>
長期保存同樣重要,尤其是隨著存儲量的增加而增加時。
O’Flaherty說:“我們的意思是,決策將由機器根據輸入的數據做出。這意味著數據無法刪除。它會繼續增長。擁有的數據越多,應用人工智能的準確性和效率就越高?!?/p>
除了簡單地存儲更多數據之外,還必須存儲更多類型的數據。其中包括有關數據(元數據)的數據,許多人認為,這些數據正成為最有價值的商品之一,尤其是在數據治理方面。
第三個要求是高性能處理。Crump說,“訓練人工智能應用程序是一個反復的過程,提高準確性是一個反復訓練的過程,調整人工智能算法,然后再進行訓練。更新迭代進行得越快,開發人員制作模型的準確性就越高,從而增加了存儲基礎設施的壓力?!?/p>
Crump說,大多數人工智能工作負載的關鍵是確保這些環境中標準的圖形處理單元(GPU)保持盡可能滿載運行。根據人工智能的工作量,Crump表示具有多個節點以及閃存和硬盤混合的橫向擴展存儲系統可能是有意義的。他說:“人工智能的工作負載往往是非常并行的,即使是使用硬盤,并行的橫向擴展存儲集群也可能會遇到挑戰。”
利用人工智能
對于剛起步的企業來說,只需從系統中提取數據,并將人工智能方法應用于選定的數據集以尋找相關性,就可以簡單地擴充現有的數據。不過,最終企業會想更深入。一旦將關鍵應用程序和系統捆綁在一起,要獲得人工智能的真正好處,可能需要部署新的基礎設施和接近數據的方式。
企業選擇的基于人工智能的存儲系統應具有智能,可以快速管理元數據,并在正確的存儲類型上存儲正確的數據。Crump說,如果企業選擇在內部部署數據中心運行基礎設施,則可以從全閃存存儲系統開始,但是最終,遷移到閃存和硬盤混合環境是有意義的。通常,環境還將包括軟件定義的存儲,該存儲可以自動執行環境之間的數據移動。
盡管某些組織傾向于將所有內容保留在內部部署數據中心,特別是那些具有敏感工作負載和合規性/數據治理問題的組織,但其他組織則可以從基于云計算的人工智能/存儲環境中受益。
HPE公司Nimble Storage產品管理高級總監Rochna Dhand說:“由于需要共享的計算能力和數據,很多事情都在云平臺中發生。從任何人工智能模型獲得的結果的質量取決于可用于訓練那些模型的數據的多樣性和數量,因此使用從云平臺中收集全球數據的系統非常有意義。”
Dhand表示,HPE公司正在研究將HPE Insight在云中提供的相同類型的全局數據分析引入用戶的內部部署環境的方法。她說,這樣做的目的是將在云中所學到的知識進行編碼,并將其作為防火墻后的內部部署更新應用。
隨著時間的推移,Dhand相信技術將不斷發展,基礎設施管理最終將完全不受干涉?!彼f:“企業將能夠預測并預防比目前更多的問題,并對這些預測和預防更有信心。不僅可以預測問題并找出解決問題的方法,而且還可以進一步確定正確的解決方案并付諸行動?!?br /> 責任編輯:dhj
-
存儲
+關注
關注
13文章
4342瀏覽量
86034 -
人工智能
+關注
關注
1793文章
47567瀏覽量
239418 -
元數據
+關注
關注
0文章
32瀏覽量
9148
發布評論請先 登錄
相關推薦
評論