數(shù)據(jù)中心管理工作需要你定期學(xué)習(xí)新知識(shí),這會(huì)使你的工作變得有趣或緊張–取決于在探索新主題時(shí)你所擁有的資源。
下面讓我們看看2020年最受歡迎的SearchDataCenter技巧,這些技巧可幫助你獲得知識(shí)并深入研究新的興趣領(lǐng)域。
分析服務(wù)器故障的主要原因
如果沒有服務(wù)器,任何數(shù)據(jù)中心基礎(chǔ)架構(gòu)都無(wú)法運(yùn)行。這意味著我們必須嘗試預(yù)測(cè)可能導(dǎo)致代價(jià)高昂的停機(jī)時(shí)間的任何潛在問題或事件—特別是對(duì)于關(guān)鍵任務(wù)硬件。
服務(wù)器故障的主要原因包括電源中斷、灰塵阻塞和溫度調(diào)節(jié)不良、固件過時(shí)、硬件配置問題和網(wǎng)絡(luò)攻擊。
面對(duì)這么多可能導(dǎo)致服務(wù)器故障的情況,重要的是部署有效的備用電源硬件;定期進(jìn)行物理維護(hù)并使用ASHRAE準(zhǔn)則設(shè)置溫度;部署定期軟件更新策略;持續(xù)檢查電纜設(shè)置;并遵守安全協(xié)議。
對(duì)于總體規(guī)劃,你的團(tuán)隊(duì)?wèi)?yīng)確保所有備用電源設(shè)置都可以正常工作,并且,制定災(zāi)難恢復(fù)計(jì)劃,以防所有數(shù)據(jù)中心意外脫機(jī)的情況。
了解Linux
Linux是服務(wù)器和數(shù)據(jù)中心管理的行業(yè)標(biāo)準(zhǔn),但是對(duì)于它的確切含義以及它在數(shù)據(jù)中心中的功能,仍然存在疑問。在最基本的級(jí)別上,Linux是操作系統(tǒng),你可以在基礎(chǔ)架構(gòu)中的服務(wù)器上運(yùn)行。
但Linux又很不尋常,因?yàn)樗情_源操作系統(tǒng),這會(huì)影響許可。GNU通用公共許可證有條款說明你可以在何種情況下使用、修改和分發(fā)該操作系統(tǒng)。在這種許可模式下,其想法是該操作系統(tǒng)仍是開源的,可供所有人免費(fèi)使用。
Linux與macOS和Windows OS的另一個(gè)主要區(qū)別是內(nèi)核。由于開源社區(qū)不斷維護(hù)和更新內(nèi)核,因此它是需要實(shí)時(shí)維護(hù)的服務(wù)器基礎(chǔ)結(jié)構(gòu)的理想選擇。Linux內(nèi)核包含用于內(nèi)存管理、進(jìn)程管理、網(wǎng)絡(luò)堆棧、虛擬文件系統(tǒng)和系統(tǒng)調(diào)用接口的子系統(tǒng),以及架構(gòu)和設(shè)備驅(qū)動(dòng)程序。
設(shè)置IT更新策略
根據(jù)你企業(yè)的規(guī)模,你可能會(huì)參與IT預(yù)算或采購(gòu)策略。每當(dāng)高層管理人員決定采購(gòu)新技術(shù)時(shí),重要的是要考慮業(yè)務(wù)原因,即為什么要臨時(shí)更新其基礎(chǔ)架構(gòu)。
升級(jí)任何技術(shù)的最大原因是服務(wù)器硬件(對(duì)任何數(shù)據(jù)中心來說都是必不可少的部分)隨著時(shí)間推移而變得越來越不可靠。IDC研究指出,服務(wù)器性能平均每年下降14%。
另外,如果你每年或每?jī)赡旮路?wù)器硬件,則你的團(tuán)隊(duì)可以了解更準(zhǔn)確的整體預(yù)計(jì)支出。這意味著你可以預(yù)測(cè)企業(yè)將花多少錢來升級(jí)硬件,而不用處理因過載或過度運(yùn)行硬件帶來的任何意外費(fèi)用。
除服務(wù)器技術(shù)外,更新策略還使你的企業(yè)有機(jī)會(huì)使用更環(huán)保更節(jié)能的硬件來降低總體運(yùn)營(yíng)成本。
購(gòu)買更新的硬件是整合基礎(chǔ)架構(gòu)并簡(jiǎn)化數(shù)據(jù)中心管理的一種方法,無(wú)論你只是需要更少的計(jì)算機(jī)還是決定運(yùn)行更多的虛擬或基于云的應(yīng)用程序。
解決內(nèi)核恐慌問題
沒有人喜歡系統(tǒng)全面停機(jī)。就像Window的藍(lán)屏死機(jī)一樣,內(nèi)核恐慌是指某些情況會(huì)突然使你的OS崩潰,例如內(nèi)存不足、惡意軟件、軟件錯(cuò)誤或驅(qū)動(dòng)程序崩潰。
為了弄清楚如何使操作系統(tǒng)恢復(fù)在線狀態(tài),可以使用kdump崩潰工具。通過此過程,你可以使用kdump工具在崩潰時(shí)收集所有系統(tǒng)信息,并執(zhí)行根本原因分析,以對(duì)Linux內(nèi)核進(jìn)行故障排除。
通過Linux發(fā)行版、兩個(gè)VM客戶端和網(wǎng)絡(luò)文件系統(tǒng),你可以使用一系列命令來安裝網(wǎng)絡(luò)文件系統(tǒng)、確定要在何處存儲(chǔ)系統(tǒng)日志,然后模擬內(nèi)核崩潰。通過此設(shè)置,你可以確定崩潰期間運(yùn)行了哪些進(jìn)程、打開了哪些文件以及存儲(chǔ)在虛擬內(nèi)存中的內(nèi)容。
這些信息以及kdump崩潰工具是執(zhí)行任何分析并使Linux內(nèi)核恢復(fù)正常的必經(jīng)之路。
正確停用大型機(jī)
在醫(yī)療保健和金融等行業(yè),大型機(jī)技術(shù)仍然具有相關(guān)性。盡管隨著新基礎(chǔ)架構(gòu)出現(xiàn)以及人員退休,你的企業(yè)可能沒有專業(yè)技能或需要運(yùn)行這些大規(guī)模計(jì)算設(shè)置。
如果你考慮停用大型機(jī),第一步是讓你的團(tuán)隊(duì)決定哪些數(shù)據(jù)應(yīng)保留在企業(yè)內(nèi)以及大型機(jī)應(yīng)支持的軟件。這將幫助你運(yùn)行應(yīng)用程序清單,從而確定企業(yè)仍需要或可停用的應(yīng)用程序。
你可以調(diào)查大型機(jī)的外包業(yè)務(wù),但這可能非常昂貴,盡管這是最簡(jiǎn)單的選擇。這樣做可以使過渡更加順暢,并消除有關(guān)物理硬件處理的問題。
還可以選擇重新構(gòu)建大型機(jī)應(yīng)用程序,使其可在x86硬件運(yùn)行,以便你可以將軟件托管在自己的數(shù)據(jù)中心或云端。只要沒有重大代碼更改,此選項(xiàng)就很容易,但是當(dāng)該軟件脫離大型機(jī),你需要使用應(yīng)用程序數(shù)據(jù)的頻率可能會(huì)影響你決定將其托管的位置。你還必須查看你的團(tuán)隊(duì)必須采用哪些新應(yīng)用程序來應(yīng)對(duì)大型機(jī)不再可用這一事實(shí)。
最后,還有大型機(jī)的物理處置,這不是簡(jiǎn)單的事情。為了正確安全地進(jìn)行移除,你應(yīng)該遷移所有必要的數(shù)據(jù),對(duì)存儲(chǔ)進(jìn)行消磁或銷毀任何硬盤驅(qū)動(dòng)器。
責(zé)編AJX
-
Linux
+關(guān)注
關(guān)注
87文章
11306瀏覽量
209572 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9176瀏覽量
85461 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4782瀏覽量
72141
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論