在云中運行工作負載可以使組織訪問無限的資源。這是一件好事,但前提是組織的IT團隊需要采用良好的容量管理實踐。
云計算模型的最大好處之一是它支持高度靈活和動態(tài)的資源使用。云計算用戶根據(jù)需要采用任意數(shù)量的資源,并且可以根據(jù)需求的變化自由調(diào)整其消耗量。
這并不意味著云平臺能夠自動優(yōu)化資源分配。對于大多數(shù)類型的云計算服務,由用戶來確定在任何時刻的云計算工作負載將需要多少資源。AWS Aurora是解決這個問題的一種嘗試,它會根據(jù)工作負載需求自動分配資源。
云計算容量管理對于有效的IT策略至關重要。它為開發(fā)人員、IT團隊和DevOps工程師提供了所需的見解,以確保其工作負載具有所需的資源。同時,它減少了以浪費預算和增加不必要的管理開銷的方式來減少過度配置工作負載的風險。
為什么云計算需要容量管理
考慮采用托管多個Web應用程序的云計算服務器。適當?shù)娜萘抗芾砜梢源_保服務器在虛擬服務器實例上運行,該實例具有足夠的CPU、內(nèi)存和存儲資源來支持應用程序,但不會導致大量資源閑置。
容量管理的另一個方面是確定在共享托管應用程序責任的集群中要采用多少服務器。在這種情況下,IT團隊必須確保包括足夠多的服務器來處理應用程序上的負載,并保持足夠的備份系統(tǒng),以確保應用程序在某些服務器崩潰時仍然可用。
這種平衡行為是容量管理的關鍵。組織希望避免無法充分執(zhí)行和分配工作負載的情況,以及避免分配不需要的資源。
Azure為用戶提供了云計算成本管理工具。但是,有效的容量管理不僅僅是優(yōu)化性能和成本的一種方式。它有助于:
深入了解長期IT規(guī)劃。例如,容量管理可以幫助確定將哪些工作負載轉(zhuǎn)移到云端。具有快速變化能力的工作負載是云平臺的理想選擇,可以在云中輕松地按比例擴大和縮小資源分配。
確定哪些基礎設施和應用程序體系結(jié)構(gòu)符合組織的需求。例如,如果組織的虛擬服務器的容量需求經(jīng)常波動,那么可能會發(fā)現(xiàn)無服務器功能將是承載其工作負載的更好方法。與虛擬服務器相比,無服務器功能使組織能夠以更具成本效益、更易于管理的方式在短期內(nèi)分配大量資源。
安排合適的人員和工具。這是組織了解需要分配給工作負載多少資源的第一步。重要的是要確定組織是否具有分配這些資源所必需的資源。組織將需要工作人員來執(zhí)行必要的配置,這些工作人員應具有使用組織用來管理資源分配的工具的必要技能。
避免對用戶造成干擾。當應用程序的工作負載為特定的問題做好準備時,以及當組織的工作負載能力得到很好的管理時,就可以將應用程序或服務器發(fā)生故障的風險降到最低。
盡管它已成為IT工作流程的一部分,但自從云計算出現(xiàn)以來,容量管理就變得尤為重要。這是因為可擴展性是組織決定遷移到云平臺決策中的關鍵因素。為了充分利用可擴展性,IT團隊必須有效且連續(xù)地管理資源利用率。如果不能,他們將錯過云計算架構(gòu)的主要優(yōu)勢之一。這樣的組織可能會堅持其采用內(nèi)部部署架構(gòu)。
管理云計算容量的步驟
云計算架構(gòu)和服務的性質(zhì)千差萬別,因此沒有單一或簡單的方法來處理云計算容量。但是,總的來說,有效的云計算容量管理策略將涉及以下幾個關鍵步驟:
(1) 評估基準容量要求
首先,確定團隊需要多少云計算服務器、應用程序?qū)嵗?、?shù)據(jù)庫等來保持足夠的性能。組織需要知道每個工作負載需要多少CPU、內(nèi)存和存儲資源——這些是組織的基本容量需求。重要的是要記住,組織不應該使用這個基準來進行資源分配,尤其是在工作負載的需求經(jīng)常波動的情況下。不過,了解基準為容量規(guī)劃提供了一個起點。
(2) 評估可擴展性需求
了解了云中運行的每個工作負載的基準要求之后,需要檢查它們所需的可擴展性。評估一天中不同時間、一周中的幾天或一年中不同季節(jié)之間的工作負載需求發(fā)生了多少變化。組織的某些云計算工作負載將比其他云計算工作負載具有更高的可擴展性要求。例如,用戶群分布全球的網(wǎng)站可能不會像針對特定地理位置的用戶的網(wǎng)站那樣出現(xiàn)太大的波動,而在該地區(qū)的白天時段,這類網(wǎng)站的需求量可能最多。同樣,提供送餐服務的網(wǎng)站在進餐時間可能會比一天中的其他時間承受更高的負荷。
(3) 進行初始資源分配
對于尚未在云中運行的工作負載,組織需要在啟動它們之前設置初始資源分配。計劃為每個工作負載分配比基準要求所指示的資源多出20%的資源。這樣可以在需求突然迅速增長的情況下提供良好的緩沖,但又不會導致環(huán)境的過度配置。
(4) 設置自動擴展策略
主流公共云提供商允許組織創(chuàng)建所謂的自動擴展策略。有了這些策略,云平臺將根據(jù)組織在策略中配置的流量閾值自動增加或減少分配給工作負載的資源。組織可以將自動擴展策略應用于大多數(shù)類型的云計算工作負載,包括虛擬機實例、數(shù)據(jù)庫、容器和無服務器功能。但是,某些特定領域的云計算工作負載(例如物聯(lián)網(wǎng)設備)通常無法使用自動擴展進行管理。
(5) 收集和分析容量數(shù)據(jù)
無論組織是否為工作負載配置自動擴展,重要的是不斷評估分配的工作狀況并進行相應調(diào)整。組織需要考慮以下指標和因素:
?組織的自動擴展策略多久觸發(fā)一次?如果由于組織的工作負載從未達到自動擴展的最低閾值而很少應用這些負載,則這些工作負載可能已經(jīng)超量配置?,F(xiàn)在可能是重新配置閾值的時候了。
按月賬單反映的實際云計算成本與預期成本相比如何?超出成本預期是組織管理容量很好的一個標志。當組織發(fā)現(xiàn)云計算支出過高時,可能會在容量管理方面做得更好。
組織多久遇到一次與容量或資源分配有關的中斷或停機?
組織的團隊多久進行一次人工干預以更正容量問題?組織可以通過更密集的自動擴展來減少對人工更改的需求,或者將工作負載遷移到其他類型的體系結(jié)構(gòu),例如無服務器。
組織為每個工作負載確定的基準工作負載要求和預期的可擴展性需求是否與實際性能保持一致?
規(guī)劃長期的云計算容量更改
以上策略將幫助組織每天管理云計算容量。此外,還需要針對長期的容量需求進行規(guī)劃,以便企業(yè)的IT基礎設施能夠隨著時間的推移適當?shù)匕l(fā)展,以滿足不斷變化的工作負載需求。
傳統(tǒng)上,長期容量管理集中于新服務器、存儲介質(zhì)和其他內(nèi)部數(shù)據(jù)中心基礎設施的購買和部署過程。這與云計算無關,在云平臺中,服務提供商已經(jīng)進行了大規(guī)模的投資,并提供了與任何客戶需求一樣多的基礎設施。
取而代之的是,云計算的長期容量管理應著重于如何隨著時間的推移適應不斷變化的容量需求。例如,如果現(xiàn)在只使用一個云平臺,需要評估組織對長期工作負載的期望,并考慮采用多云策略來滿足未來的容量需求是否有意義?;蛘?,組織可能決定通過重構(gòu)應用程序使其在容器內(nèi)作為微服務運行,從而提高組織的長期容量效率。
云計算容量管理工具
云計算容量管理是一個復雜的、多方面的過程,沒有一種萬能的工具可以滿足組織所有的容量規(guī)劃需求。多種工具可以幫助組織完成此過程,其中包括:
監(jiān)視和日志管理。通過監(jiān)視和日志記錄工具(例如AWS CloudWatch、Azure Monitor和第三方監(jiān)視平臺)收集的數(shù)據(jù)可以幫助組織跟蹤性能趨勢,并提醒不斷變化的容量需求。
基礎設施即代碼?;A設施即代碼工具可自動進行基礎設施設置和資源分配,因此,根據(jù)容量變化重新配置分配變得更加容易和快捷。
成本計算器。為了管理容量規(guī)劃的財務方面,云計算提供商提供的成本預測工具非常有用。他們可以幫助評估與不同資源分配或工作負載類型相關的成本。
調(diào)整大小和成本管理。云計算提供商提供了旨在幫助預測容量需求的工具。AWS和Microsoft Azure都提供成本管理工具。一些第三方應用程序性能管理(APM)工具還提供了調(diào)整大小的功能。
容量管理在任何IT環(huán)境中都很重要,但是如果組織希望充分利用云計算環(huán)境,這一點尤其重要。盡管沒有一個萬能的云計算容量規(guī)劃方法,但多種技術和策略的組合將幫助組織確保準確評估容量需求,即使是對于在云計算基礎設施上運行的快速變化的工作負載也是如此。
責編AJX
-
云計算
+關注
關注
39文章
7806瀏覽量
137402 -
服務器
+關注
關注
12文章
9160瀏覽量
85421 -
策略
+關注
關注
0文章
36瀏覽量
17331
發(fā)布評論請先 登錄
相關推薦
評論