數(shù)據(jù)庫場景下,由于操作系統(tǒng)某些進程操作(比如磁盤、網(wǎng)絡(luò)等)占用I/O帶寬過高,造成應(yīng)用因為I/O帶寬不足產(chǎn)生性能劣化的問題,如何快速、準(zhǔn)確地診斷應(yīng)用性能問題,并對問題進行定界定位是運維人員的重要挑戰(zhàn)。
案例一
GaussDB應(yīng)用磁盤IO類故障在線診斷
該案例通過對Gaussdb應(yīng)用注入磁盤IO故障來模擬。
1
故障注入前
應(yīng)用實時拓?fù)潢P(guān)系如下圖所示,gaussdb應(yīng)用包含1個master(進程id:1548)和1個slaver(進程id:1739),運行在虛擬機vm02上,gaussdb master有5個客戶端TCP連接。
此時,gaussdb的應(yīng)用性能如下圖所示,平均600 TPS。
2
注入故障
在gaussdb的數(shù)據(jù)目錄注入磁盤讀寫故障,命令如下:blade create disk burn --read --write --path /data --timeout 120
3
應(yīng)用性能診斷
此時應(yīng)用性能出現(xiàn)劣化,從大概600 TPS → 60 TPS,下降了近10倍,如下圖所示:
故障發(fā)現(xiàn)與定位結(jié)果如下圖所示,可以看出已產(chǎn)生應(yīng)用性能劣化事件,原因是磁盤讀寫響應(yīng)異常。
具體的故障傳播關(guān)系如下圖所示,可見應(yīng)用性能劣化是因為磁盤寫響應(yīng)異常以及block層request時延異常,進一步的磁盤類異常是由于故障注入工具chaos(進程id:3941335)導(dǎo)致。
案例二
Redis應(yīng)用網(wǎng)絡(luò)時延類故障在線診斷
1
注入故障
通過故障注入工具ChaosBlade注入2分鐘網(wǎng)絡(luò)時延故障,具體命令:blade create network delay --time 50 --offset 50 --interface ens1 --local-port 3742 --timeout 120
故障注入期間redis sli指標(biāo)出現(xiàn)明顯劣化,大概從10ms → 80ms
2
應(yīng)用性能診斷
故障發(fā)現(xiàn)與定位結(jié)果如下圖所示,可以看出已產(chǎn)生應(yīng)用性能劣化事件,原因是網(wǎng)絡(luò)時延異常。
具體的故障傳播關(guān)系如下圖所示,可見應(yīng)用性能劣化是因為網(wǎng)絡(luò)時延異常導(dǎo)致。
審核編輯 :李倩
-
操作系統(tǒng)
+關(guān)注
關(guān)注
37文章
6838瀏覽量
123389 -
磁盤
+關(guān)注
關(guān)注
1文章
379瀏覽量
25214 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3816瀏覽量
64465
原文標(biāo)題:A-Ops 數(shù)據(jù)庫場景在線應(yīng)用性能診斷案例
文章出處:【微信號:openEulercommunity,微信公眾號:openEuler】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論