電子發燒友網報道(文/李彎彎)1月4日,西安“一碼通”又發生故障了,直到當天下午才逐漸恢復正常,根據陜西發布的消息,一碼通首頁顯示正常,但點擊不能順利進入。有市民接到通知:全市核酸檢測應急平臺因當前流量過大,網絡目前繁忙無法登陸,正在搶修。
這不是西安“一碼通”第一次發生故障,2021年12月20日,西安“一碼通”就曾因訪問量過大導致系統崩潰,無法掃碼,導致許多西安市民,難以進行核酸檢測。
“一碼通”宕機對市民日常生活影響有多大?西安市民出行、上班、出入小區都需要出示“一碼通”,同時持48小時核酸檢測。一碼通故障,使得西安交通出現擁堵,核酸檢測也需要耗時更長,這不僅影響市民正常生活,還可能增加交叉感染的風險。
西安需要盡快解決“一碼通”接二連三崩潰的問題,而這就需要找到“一碼通”崩潰的真實原因是什么?
真的只是網絡擁堵導致崩潰嗎
根據官方的說法,是因為網絡擁堵。上一次系統崩潰的時候,即2021年12月20日,在西安疫情防控記者會上,彼時西安市大數據局局長劉軍表示,12月20日早7時40分左右,西安“一碼通”用戶訪問量激增,每秒訪問量達到以往峰值的10倍以上,造成網絡擁塞,致使包括“一碼通”在內的部分應用系統無法正常使用。
“對于‘一碼通’平臺中斷對市民造成的不便,我們深表歉意,我們將持續加強對平臺的監控,‘一碼通’平臺技術團隊將24小時不間斷駐場運維,加強網絡及系統資源保障,確保‘一碼通’平臺良好運行。”劉軍說,在全員核酸檢測的特殊時期,為減輕系統***非必要不展碼、亮碼,在出現系統卡頓時,請耐心等待,盡量避免反復刷新。
因為西安“一碼通”多次崩潰,1月5日凌晨,西安市大數據資源管理局黨組書記、局長劉軍因履職不力,停職檢查。
那么如何解決網絡擁堵帶來的系統崩潰呢,最直接的辦法是,限流和擴容。在2021年12月30日,工信部總工程師韓夏曾到西安調研,他就強調,要持續做好大數據和信息化支撐,西安“一碼通”要加強技術改進和網絡擴容,確保平臺安全穩定運行。
然而真的是網絡擁堵造成系統崩潰,此前武漢疫情的時候,為什么沒有宕機的情況,武漢的長住人口,比西安更多哦,資料顯示,2021年西安市常住人口數為1295.29萬人,武漢市常住人口達到1351.5萬。
有熟知網絡系統的人士認為,網絡擁堵可能只是表象原因。據他分析,西安“一碼通”已經上線很長時間,大多數時候是穩定的,西安的上班高峰期,也就是說掃碼高峰期,大概是在8點到9點之間,而幾次崩潰卻都發生在7點多,這個時候,網絡應該是不擁堵的。
而且即使真是網絡擁堵導致系統崩潰,其實很容易解決,就如上文說的,限流、擴容,這個操作并不難,而且耗時不長。比如說限流,只需要把一部分網絡請求阻攔住,讓另外部分網絡請求通過就可以,擴容就是增加服務器的硬件,比如內存、CPU,或者如果服務器有集群,可以增加更多服務器。
如今計算機系統,基本都是部署在云上,西安“一碼通”聽說是部署在阿里云上,在云計算平臺上限流、擴容,可能并不需要花費大半天時間,而西安“一碼通”上一次崩潰,到恢復耗費了一整天時間,這次也花費大半天。
另外還有一個很奇怪的現象,就是在12月20日當天,“一碼通”的樣式回滾到了幾個月前,據描述,從10月底開始,“一碼通”二維碼就有了邊框注明***接種的狀態,而在12月20日上午這個樣式里是有邊框的,到下午系統恢復之后,卻沒有邊框,顯示的是幾個月前的樣式,據該人士分析,如果是流量太大,直接優化網絡和硬件就可以,程序怎么會回滾到幾個月前,真正的原因可能是,程序出了問題,一時改不好,所以直接找到以前的版本運行。
再次崩潰的真實原因是什么
另一位技術工作人員就“一碼通”再次崩潰原因也進行了分析,他認為,是因為高并發下緩存被擊穿,且未用時序數據庫,要解決這個問題,只有幾天時間是來不及的。
該工作人員表示,集群擴容、性能調優,這些快速見效的方法肯定都已經做了,還是會瞬間宕機,而最深層的原因是,“一碼通”平臺自身系統設計的問題,系統性能不夠,短時間很難解決,現在只能是做好限流熔斷,避免全面崩潰。
針對“一碼通”崩潰的問題,有10余位來自騰訊、華為、中興等企業人士,從前端、后端、測試等多個方面進行過分析,也談到系統設計的不足。
比如說,市民因為長時間無法刷出健康嗎,多次退出刷新,導致更多新流量送達服務器,給服務器帶來壓力,這其實也說明西安“一碼通”的系統在限流措施上沒有做好。
再比如,“一碼通”平臺在設計的時候,可能并沒有考慮到高流量、高負載的情況,產品設計未考慮千萬級的并發訪問,而且交付前未進行同等級的壓力測試。
為什么會出現這些情況,或許與項目實施過程中的一些不妥舉措有關。據了解,現在正在運行的“一碼通”,是由市大數據資源管理局牽頭,中國電信西安分公司開發部署,作為總承包方,中國電信將該項目全部外包招標,而采購來源單一。
這里列出部分采購信息:
“一碼通”系統建設單一來源:西安東軟
“一碼通”安全配套單一來源:杭州安恒
可視化工程單一來源:中譯語通
200W的短信服務單一來源:阿里云
并不是說單一來源就一定會出問題,讓人疑惑的是,這么大的項目,為何不可以進行多渠道采購,比如說,配套安全項目,全部采購自杭州安恒,估計這么大的項目,金額都是百萬以上,因為都是標準設備,其實市面上可供選擇的產品很多,為什么只選擇一家。
另外還有一個很奇怪的情況,在2020年上線的時候,由西安市大數據管理局為主單位籌建的西安“一碼通”系統,因為建成效果非常好,曾獲得表彰。然而在2021年11月26日,以西安科技局為甲方牽頭單位的西安“一碼通”系統開發項目公開采購結果。
也就是說,西安已經計劃不再使用由西安市大數據管理局為主籌建的“一碼通”系統,而將更換為由西安科技局牽頭的“一碼通”,這不猶讓人猜測,是不是在2021年12月20日之前,現行的西安“一碼通”系統已經顯現出問題,因此更換牽頭方。
總結
截至1月4日,西安現有確診病例1741例,新增確診病例95例,幾乎成為繼2020年武漢以來疫情非常嚴重的城市。因此,保證“一碼通”系統的穩定性,攻克上述提到的問題,是目前的當務之急。
然而就如上文所言,如果是系統本身架構設計的問題,短期內只能做到讓系統恢復運行,未來崩潰宕機的情況可能還是會時而發生,或許當前也只能期待由西安科技局牽頭的“一碼通”新系統項目早日完成,而且期望它在系統設計上做到更好。
-
電信
+關注
關注
2文章
730瀏覽量
61963
發布評論請先 登錄
相關推薦
評論