近三年,中國云計算市場在多個維度同時發生著劇烈變化——疫情極大加速了全社會對于數字化的認知和接受程度;一系列云原生技術依托著開源和蓬勃的市場而迅速發展演變,更多產品和技術名詞同時涌向市場;國際關系復雜化下的信創云浪潮撲面而來......
在這樣一個技術和需求都在快速演變的供需環境中,云計算市場競爭走向存量市場的較量,留給所有玩家的空間都更加逼仄。
對于已經穿越過十余年風浪的青云科技而言,如何在這些劇烈的變化中尋找新航道,再一次對其戰略眼光提出了考驗。
在9月19日的“AI算力發布會”上,青云科技宣布了全新的戰略方向——發力AI算力,與生態圈共建,以滿足企業復雜的AI需求。
令人好奇的是,打出的“AI算力牌”,能否成為青云科技備戰下一個10年的重要支撐?
AI是云計算競爭的新機會
當下最火熱的技術莫過于AI,隨著ChatGPT成功帶來的新一代AI浪潮,引發了全球科技巨頭在AI大模型層面的“軍備競賽”。
作為AI大模型的發展基石,AI算力的需求也得到大幅提升——無論是基于通用大模型微調的行業應用,還是垂直行業的大模型訓練,都需要大量的AI算力進行支撐,其規模還在隨著大模型的成熟落地而不斷攀升。
而在AI大模型熱潮涌現之前,AI作為一種新的生產力工具已經在各行業場景中發揮作用。伴隨AI技術的迅速發展,算力基礎設施由通用算力為主,向通算、智算、超算一體化演進,市場對AI算力乃至多元算力的需求愈加強烈。
一個明顯的變化是,在國家政策的大力倡導下,全國各地都在積極打造大型智算中心,以推動國家新一代人工智能公共算力開放創新平臺的建設。
同時,“東數西算”工程也推動著各地包括智算中心、超算中心在內的算力中心建設,以提升國家整體算力水平。
中國信通院《中國綜合算力指數(2023年)》顯示,近5年我國人工智能算力在整個算力結構中的占比已經超過25%,同比增加60%。未來算力仍會保持高速發展,尤其是智能算力將成為未來算力增長的主要動力。
毫無疑問,云計算作為AI算力不可或缺的基礎設施,AI算力需求的爆發正在為云計算市場帶來更多增量。有業內人士認為,隨著企業對AI投入占比的持續增加,對于底層算力的需求,會帶來10倍乃至100倍的市場規模增長。
在青云科技總裁林源看來,AI為云計算打開了全新的增量市場,并且會帶來一波長達10年以上的市場需求,這正是青云新一輪競爭的機會。
但機會總是伴隨著挑戰,AI技術催生的新市場,從客戶需求到對算力、應用、底層架構的要求,都發生了巨大的變化:
過去數字化轉型,企業應用以傳統應用為主,如今以云原生和AI應用為主;過去企業對于底層算力以CPU為主,如今變成了CPU、GPU異構多元算力;過去互聯網業務主要是延遲敏感型應用,但如今企業會兼顧成本型應用,業態變得更加豐富。
這些變化對技術和平臺挑戰越來越多,也讓幾乎所有的云服務商重新回到同一起跑線,爭奪AI算力這一新增市場。
那么對于青云科技來說,發力AI算力,到底有多少勝算?
“AI算力調度平臺” 搶跑AI算力賽道
自2022年國務院發布《“十四五”數字經濟發展規劃》以來,重點提到要推進云網協同和算網融合發展,促進智能計算中心構建,目前智算中心已成為各地政府的重點項目。據不完全統計,全國至少有30座城市已經建成或正在建設智算中心,這還不包括企業自主建設的智算中心。
可以說現階段是一個算力集中建設的時期,但無論是地方政府、國央企,還是地方AI集成商,想要建設好一個智算中心都面臨著巨大的挑戰。
一方面,智算中心投資巨大,能否盈利取決于運營效率和平臺能力;另一方面,相比于建設,中后期的運營則更為復雜,要面對更為現實的技術和應用落地問題,比如:云計算、超算、智算等多元算力如何統一調度?
傳統應用、云原生應用、AI應用如何同時兼顧?如何支持異構CPU/GPU、提供高效的網絡與存儲?大規模智算中心如何高效的運維和運營?
在智算中心高速擴張的早期階段,由于缺少統籌規劃和技術經驗,項目失敗不在少數。某大廠斥巨資建設的智算中心,由于只支持國產GPU,上線時發現很多應用根本無法支撐,導致整個智算中心無法投入運營。
與之類似的還有超算中心想要兼顧智算中心的功能,雖然超級計算機提供高精度算力,但卻是為科學計算、超算等場景而生的,對于AI所需要的大規模、低精度算力并不適用,因此這一想法也并不現實。
不難發現,智算中心并不缺建設者,關鍵挑戰反而是在建設后的運營階段,誰能更好地解決這一難題,誰就能優先拿到AI算力的門票,而青云科技無疑是其中的佼佼者。
2019年,國家超級計算濟南中心實施規劃——打造全新的百億億次異構融合算力平臺,以滿足日益旺盛的“新基建”需求。
青云科技作為唯一的算力調度平臺供應商,為國家超算濟南中心提供了“一個平臺納管多種算力服務、一站式統一管理、跨平臺便捷應用部署”的算力運營服務。
作為當時全亞洲最大的計算中心之一,國家超算濟南中心擁有1000P的算力、超 300 PB的存儲,打造的算力服務包括HPC超算、傳統云計算(以CPU為主)、智算(兼顧國外及國產 GPU),是一個名副其實的多元且異構的算力中心。
這樣一個龐大的復雜體系,必然對平臺建設方和運營方提出了極高的要求。據林源回憶,當時從底層的芯片、服務器、存儲、交換機、安全設備到上層的云平臺,業內幾乎所有頂尖的廠商都參與其中,但整個項目的算力調度運營平臺是由青云獨家供應的。
在算力調度上,青云科技屏蔽了超算服務器、AI服務器、通用服務器等多種異構基礎設施的差異,向下接駁異構化的算力和硬件平臺,實現對算力的統一納管、調度、配給和全生命周期管理,進而向上支撐各種行業應用,為傳統HPC科學計算、政務云、智慧城市等AI應用提供完整的算力服務。
如今,國家超算濟南中心已穩定運營3年,且已經開始盈利,成為國內多元算力中心成功運營的典范。盡管這種成功看起來毫不費力,但背后其實凝結了青云科技長期以來的技術積累和運營經驗。
作為中國最早一批推出公有云服務的云服務商,青云科技在算力的調度、運維、運營等方面,已歷經了十多年的大規模市場驗證。
2020年在洞察到國家“新基建”政策背后的算力中心和多元算力的需求后,青云科技提前三年就開始布局算力領域,從而具備了服務算力中心建設三要素(架構/能耗管理、多元算力操作系統以及多算力集群運營)的能力。
據青云科技產品經理苗慧介紹,青云AI算力調度平臺具備九大關鍵能力——多區多業務資源整合、高速并行存儲、混合組網、分布式調度與管理、靈活調度、容器推理服務平臺、算法開發支持、模型倉庫(MaaS)、AI訓練平臺。
例如,在資源調度上,青云科技在多個方面進行了優化:為了適應AI行業特點,實現了立即調度擴容數萬卡資源;在通信鏈路上,所有的節點、服務器、存儲都打上了路徑標簽,可計算調度最短鏈路,讓數據不繞路;支持異構平臺,加速國產GPU芯片替代;使用“K8s+Slurm”對作業感知的管理,實現最大系統利用率;廣泛的調度選項、動態靈活的資源調度可配置,使得運營管理員可以通過排隊、調度、手動調度等方式,解決AI系統中最具挑戰性的優先事項。
在混合組網上,青云科技也基于傳統的云計算領域,增加了高速網絡,在多區域(AZ)構建了統一服務計算平臺,能夠支持跨區域高速網絡互聯、不同類型資源池互聯、獨立計算和存儲IB網、專屬訪問存儲高速網絡、業務網絡互連下發任務等。
用戶在申請資源時,無論是按卡還是按節點申請,都能保證數據的安全隔離。
在AI訓練平臺上,青云科技集成了常用的訓練模型框架,并提供GPU服務器在線申請、自動調度的集群,使得AI訓練的所有網絡和環境都可以一鍵生成。
整體而言,青云科技在AI算力領域的成功并非偶然,而是在AI算力調度和運營方面下了“狠功夫”的必然結果。
目前,除了國家超算濟南中心,青云AI算力調度平臺還應用在清華天津電子院智算科研教學平臺、上海科發SciPlus科研云等算力融合創新場景中,成為各類算力中心運營者的關鍵工具,助力算力中心建立從建設到運營的閉環。
AI算力云服務走向AI共贏
事實上,不僅是智算中心的運營者需要面對AI算力的挑戰,AI作為一個非常寬泛的領域,產業鏈各方對于AI算力都有著復雜且多樣的需求。
從最終用戶角度看,企業、科研機構在進行AI大模型訓練和推理時需要巨大的計算量,他們渴望更低成本的AI算力資源。
同時,AI訓練和推理的響應效率,會影響業務應用實時響應和決策的速度,他們渴望穩定的、優質的底層基礎設施,提供更加高效便捷的AI算力資源;AI的高技術門檻,讓很多企業對技術的使用產生了極大阻力,他們渴望AI算力服務能夠進一步降低AI技術的使用門檻......
對此,青云科技依然發揮了自身在云服務上的優勢,打造和持續升級了一系列高性能、彈性敏捷、安全可靠的算力產品及服務,以滿足企業通算、超算、智算等多樣化的算力需求。
目前,青云科技已基于完整的算力基礎設施,能夠為工業仿真、大氣環境、醫療醫藥、教育科研、交通物流、自動駕駛、智慧政務等領域企業提供蓬勃算力,驅動業務創新。
青云科技2023年半年度報告顯示,歸屬于云服務業務的AI算力云服務,上半年已經成為公司非常重要的新增長點,實現收入突破,收入規模為2651萬元。
有別于互聯網大廠在AI大模型和算力建設上的“高舉高打”,青云科技反其道而行之,在AI算力云服務上走出了一條“輕資產”的道路。
眾所周知,公有云服務一向是投入高、盈利難的業務,但青云科技在過去幾年已確立了“精品化創新,高質量發展”的長期戰略,更加注重盈利能力的建設。
因此,重金自建公有云不再是青云科技的選擇,對于AI算力云服務的建設也同樣遵循這一原則:一是不自建AI大模型;二是通過“生態同盟”的方式共同建設和運營AI算力云服務。
在青云科技總裁林源看來,“生態同盟”是AI時代的必然產物,企業一定是通過算力服務、算法和模型、高價值的數據來實現智能化,這也是AI生態體系的價值所在。
“最終用戶要的是一個完整的解決方案,包括:機房、底層算力基礎設施、算力調度平臺、模型驅動、上層應用等等,每一層都需要專業的供應商投入大量的技術和時間才能建設好,所以我們認為AI領域會比以往更需要生態,而不是依靠一家獨立的公司從下至上全部自建”,林源表示。
因此,在青云科技AI算力的生態同盟中,從底層算力基礎設施方、中層大模型資源方、數據資源方,到上層算力運營方、行業應用方一應俱全,生態里的每位參與者都是專業且彼此需要的,大家以開放合作的心態一起實現整體能力的整合,從而走向AI共贏。
比如,青云科技會與專業的大模型廠商或AI團隊聯合,針對客戶AI相關業務提供場景化方案,協助客戶完成數據采集、算力平臺建設、模型訓練和推理、定制化模型、公私混合云部署等,最終構建或落地符合真實需求的AI應用。
AI算力“雙輪驅動”備戰下一個十年
整體來看,青云科技以AI算力調度平臺和AI算力云服務為“雙輪驅動”,共同支撐其“AI算力戰略”的發展。
在AI算力運營方面,青云科技基于開放的、成熟的、可運營的AI算力調度平臺,與大型政企、科研機構、運營商等智算中心建設方與運營方相互配合,扮演好算力運營技術服務商的角色。
在AI算力云服務方面,青云科技基于公有云能力打造了全面的算力基礎設施,與生態同盟一起通力合作,為企業提供多樣化的算力服務支撐,承擔起AI算力云服務商的責任。
在青云科技總裁林源看來,AI算力未來一定會成為青云科技主營的業務模式,這是由市場決定的,“不管是互聯網客戶,還是傳統行業客戶,大家都在轉向AI,所以我們的生意模式也是這么驅動的”。
而打造AI算力恰恰是青云科技最為擅長的。在過去云計算十余年的發展浪潮中,青云科技從公有云、私有云、混合云到云原生、信創云,一次次歷練著自身云平臺的能力。
隨著AI時代來臨,與青云云平臺一脈相承的AI算力調度平臺得以乘風而上,多年積累的技術實力讓對手難以望其項背,很大程度上成為搶跑AI算力賽道的“殺手锏”。
同時,青云科技作為一個中立的服務商,既能滿足客戶不被綁定、賦能其獨立運營的核心需求,也擁有大規模市場驗證過的技術實力。
即便眾多廠商都想進入AI算力運營這一賽道,但青云科技憑借自身清晰的定位和過硬的技術實力,在AI算力運營上擁有了無可比擬的差異化競爭優勢。
如今,堅持“輕資產”路線、擁抱生態的青云科技,再次輕裝上陣,全力奔向下一個十年。在走向AI星辰大海的路上,青云科技或將迎來自己新的黃金時代。
【關于科技云報道】
專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創報道云計算、大數據、人工智能、區塊鏈等領域。
審核編輯 黃宇
-
云計算
+關注
關注
39文章
7800瀏覽量
137396 -
AI
+關注
關注
87文章
30887瀏覽量
269065 -
算力
+關注
關注
1文章
977瀏覽量
14809
發布評論請先 登錄
相關推薦
評論