開放數據中心峰會(ODCC2020)在北京召開,峰會圍繞數據中心新基建為主題,有數據中心領域及相關行業的眾多專家與會。在9月16日網絡分論壇上,阿里巴巴的高級技術專家王永燦先生就阿里近年來自研交換機的實踐和探索進行了分享。
阿里巴巴高級技術專家王永燦
王永燦:隨著阿里云業務的快速發展,我們的數據中心網絡已經發展成為一個超大規模的網絡,傳統的商業設備在運維的穩定性和效率都是帶來了很大的挑戰,網絡芯片在摩爾定律下仍然保持高速狂奔,基本上每兩年芯片帶寬就會翻一倍,所以阿里數據中心網絡已經全面走向自研。
我們的自研交換機是盒式的單芯片交換機,整個數據中心實現了整集群全自研,包括自研光模塊、自研DAC。基于自研交換機,實現了多平面可擴展的新一代網絡架構,實現單集群可部署超過10萬臺服務器
自研交換機和商業設備到底有什么區別?商業設備面對的是多客戶、多場景,所以特點是功能非常全,什么場景都可以用,數據中心對功能的要求不多,但對穩定性和運維的效率有非常大的挑戰,自研交換機正是這個場景的專用設備。
首先我們在功能上要求極簡,因為簡單所以穩定,而實際上要做到真正的簡單比復雜更難。另一方面,在特定場景上,需要做到極致,來提升運維效率。舉個汽車換輪的例子,家用汽車有一個備胎,更換一般需要幾個小時。但是在一級方程式中,賽車需要在幾秒內完成4個輪胎的更換,因此需要人和車的完美結合,整體能力的輸出,自研交換機也一樣,通過自研將架構、管控、運維和研發結合起來,形成一個內部閉環的、迭代的體系,來提升整體網絡的能力。下面,在幾個代表性的場景上,進行詳細的介紹。
首先大規模網絡穩定性的最重要一環是監控。而商業設備是一個黑盒,因此主要以外部流量相關的監控為主,而自研交換機是白盒,是系統內部的代碼級監控。其次,我們把運維經驗與設備系統結合,設備可以主動告警、自修復。另外,在大規模網絡里,如果告警有噪聲,那么這個監控幾乎是不可用的,因此自研機在本地進行數據分析,消除噪聲,精確告警。最后,在監控數據的顆粒度上,從分鐘級提升到秒級,可以看到任何一秒的流量數據,使監控進入了秒級時代。因此雖然自研是新系統,新芯片,新硬件,但是比商業機更穩定,至今保持著0故障的記錄。
在數據中心網絡中,設備的硬件故障占比高,而硬件故障有兩個痛點:第一是硬件宕機故障,處理不可控,第二是,根因定位困難,重復發生。因此我們在自研上引入了服務器的BMC,并自主研發了BMC的OS – AliBMC。通過AliBMC,對硬件部件級監控,對CPU和轉發芯片定制化監控,使硬件故障可分析、可定位。另外通過標準化底層接口,與硬件解耦,從差異化的設備,變為統一的軟件系統,完成了運維設備到運維軟件的轉變。最后我們將AliBMC向ODM進行了開源,來促進白盒的生態發展。
隨著自研的規模部署,設備鏈路也進入了百萬級。而以往的鏈路排查,是人工排查,靠換靠試,幾乎每天都需要花大量的人力、物力。鏈路排查的難點在于,涉及多器件,而且信號串聯,互相干擾,一個器件有問題,多個器件狀態異常,而且還與軟件、配置、甚至機房環境、現場的人都相關,所以時間不可控,10天半月都很正常。因此我們在自研上,通過AliNOS將設備軟硬件技術、光模塊技術、運維經驗深度融合,研發了鏈路自動診斷系統 -- 明眸,通過明眸,對鏈路實時監控、自動分析原因,建立數據大盤,實現百萬級鏈路的智能化運維。
最后,問題修復、新功能發布,都必須依賴設備的升級,而大規模網絡升級對效率和業務無損有極高的要求,因此我們在自研上從冷升級全面轉向了熱升級。AliNOS是一個開放的標準Linux,所有模塊都以Docker的方式部署,各個容器間通過DB通信。通過DB進行數據的存儲、恢復,實現了基于Docker的熱升級,做到升級對業務無損、0感知。另外通過AliNOS屏蔽了硬件差異,所有硬件型號一個版本、一個補丁,1萬臺和1臺無差別升級,簡化了運維復雜度,提升了運維效率
最后總結一下,通過自研交換機,我們把設備、運維、架構和管控進行結合,形成了一個內部的閉環,所以在很多場景都要做更多的智能化運維,以及針對高性能的新技術進行創新。
責任編輯:gt
-
交換機
+關注
關注
21文章
2647瀏覽量
99868 -
數據中心
+關注
關注
16文章
4830瀏覽量
72251 -
阿里巴巴
+關注
關注
7文章
1617瀏覽量
47345
發布評論請先 登錄
相關推薦
評論