電子發燒友網報道(文/周凱揚)為了進一步減少成本,把自己的服務做出差異化,不少半導體行業外的廠商都紛紛加入了造芯的隊列中來,比如互聯網公司、云服務廠商等。絕大多數的參與程度并不算深,有的選擇組建一個小的設計團隊,直接購買第三方IP來拼湊出一個可用的芯片,有的則選擇收購初創半導體公司,去走傳統的芯片設計路線。
不管是哪種方式,對于云服務廠商來說,擁有自研芯片都是一個極其誘人的選項,甚至不惜花費大量研發成本傾力打造。但頭部云廠商的芯片自研實力發展到現在究竟如何,不少人還沒有一個大致的概念,我們不妨以排名前三的亞馬遜、微軟和谷歌為例,一探他們在自研上付出的努力以及國內云服務廠商是怎么迎頭趕上的。
亞馬遜——已經成為不容小覷的半導體公司
要說開始自研服務器芯片的話,亞馬遜可謂是最具前瞻眼光的云服務廠商了,他們多年前收購的以色列芯片設計公司Annapurna Labs,已經幫助他們自研出了通用CPU、AI推理/訓練和網絡芯片,且每一個都有著極致的競爭力。這也是為何在Gartner的“云基礎設施和平臺服務魔力象限”數據中,AWS每年都能在領導力象限遙遙領先的原因。
以亞馬遜的Graviton系列芯片為例,由于AWS龐大的體量,可以說是一舉撐起了Arm服務器芯片的市場占有率,以極高的性價比優勢吸引了更多客戶選擇了AWS。再者就是Inferentia推理芯片和Trainium訓練芯片,在這兩大產品的定位上,亞馬遜很好地避開了與英偉達GPU直接競爭,而是作為一個根據性價比的方案,如果客戶追求極致的性能和更完善的開發生態,還是可以直接選擇AWS的GPU方案。
亞馬遜自研芯片的理由也很好猜,除了降本增效外,必然是進一步提升難以復制的競爭力。要知道,在AWS利潤一再攀升后,不少競爭對手都開始復制亞馬遜的商業模式,也一并獲得了成功。大家都是一樣的API模式,一樣的云計算硬件,所以亞馬遜不得不想出一個難以復制,至少是短期內難以復制的方案,自研芯片。
谷歌——自研TPU雖好,但還是別人的GPU更香?
谷歌自從自研TPU以來,就在大力發展谷歌云的AI云計算業務,就拿全新的TPUv4加速器為例,谷歌在2022年就宣布已經建成了8個TPUv4集群。一年過去,谷歌必然已經在多個數據中心搭建了更多的集群。要知道,單是一個集群的芯片,就可以提供1exaflops以上的峰值AI計算性能。這樣的擴展性及性能,足見谷歌在AI芯片上可怕的研發實力。
可谷歌雖然有自研芯片,但依然還是陷入了一個相當尷尬的局面,那就是其自研芯片鮮有人買賬,主要是自己的搜索和廣告服務平臺在用。這點從市場份額也可以看出,這么多年亞馬遜一直維持著領先地位,但落后的Azure和谷歌云其實打得有來有回,可從2022年的數據上來看,微軟的Azure市場份額已經接近谷歌云的兩倍。
可以看出,谷歌的云服務策略顯然出現了問題,其自研芯片的吸引力還是不夠大,但推動自研芯片對其業務運營本身還是有些成效的。比如從今年第一季度的業績上來看,盡管谷歌的主心骨廣告業務出現了下滑趨勢,但谷歌云業務部門卻實現了自公布收入以來的首次盈利。其中當然也有市場總量擴張和業務利潤率提升的原因,但結合其市場份額下滑的趨勢來看,很明顯成本上得到了很好的控制。
這就導致了雖然谷歌仍在加大力度自研芯片,比如傳言中很快就會亮相的TPUv5,但谷歌依然是英偉達GPU最大的買家之一。所以至少對于現在的谷歌來說,自研芯片對自身其他業務的增強,要遠超谷歌云業務。
微軟——自研芯片已在路上
到了微軟這,芯片自研的情況就有些復雜了。由于和谷歌一樣業務眾多,微軟本身除了Azure云服務業務外,還有不少消費業務,其中也用到了不少特殊的芯片。諸如高通的筆記本芯片、AMD的游戲主機芯片,可以說微軟在芯片上的努力更多是與第三方展開合作。畢竟這么多年以來,微軟內部并沒有追求打通自研芯片設計的全流程,更多的精力還是放在了完善產品上。
同樣的情況發生在云計算業務上,多年來遲遲不見微軟有更大的動作。盡管憑借著與OpenAI等廠商的合作,微軟Azure一舉甩開了谷歌云,穩穩占據了第二的地位,甚至有劍指亞馬遜AWS的意味,但似乎還差了一口氣。
在去年年初,微軟從蘋果挖來了一位半導體老將,曾任Arm首席架構師的Mike Filippo,且就職于Azure部門。此舉足以表明,在亞馬遜和谷歌兩者各種動作的刺激下,微軟已經開始加速推進其服務器自研芯片項目了。
彭博社爆料,微軟已經組建了一個數百人的獨立團隊,與AMD聯合開發一款代號名為“Athena”的AI芯片,欲直接挑戰英偉達在AI處理器上的霸主地位,據傳此次開發項目已經投入了20億美元。
不過和已經自研芯片落地的亞馬遜和谷歌一樣,微軟也會采取多樣化的方案,不會因為自研芯片就與英偉達等第三方芯片廠商分道揚鑣,給到客戶更多的選擇向來都是云服務廠商拉攏更多客戶的方式之一。
國內云廠商的努力
其實這幾年國內的云服務廠商也陸續推出了自研芯片,從現有的芯片布局來看,他們與國際巨頭的策略也有不少相似之處。比如阿里巴巴平頭哥團隊自研的倚天710,從架構和性能上來看,明顯對標的就是亞馬遜的Graviton,且根據阿里巴巴的說法,目前倚天710已經大規模應用于阿里云的數據中心,可以預見倚天710以及后續的數據中心CPU產品將為其繼續節省成本,并提供更具性價比的方案。
從平頭哥的實力來看,他們既有根據Arm Neoverse架構開發高性能處理器的實力,也有憑借自研玄鐵架構打造高性能RISC-V處理器的能力。且在去年8月,平頭哥已經參與并聯合成立了開源龍蜥社區的RISC-V架構聯合小組,相信不久我們就會在阿里云看到“一云多芯”的局面。
至于騰訊云,這家在Gartner魔力象限圖譜中屬于小眾玩家象限的云服務廠商,對自己的定位相當明確,所以目前還是以數據中心特定應用的自研芯片為主,比如用于AI推理的紫霄芯片、用于視頻轉碼的滄海芯片和智能網卡芯片玄靈。雖然這三大自研芯片并非高性能的通用CPU,但針對的均屬于在國內相當吃香的應用,包括騰訊自己的不少業務,其中尤為亮眼的就是滄海芯片。
在直播/點播平臺、云游戲等場景中,視頻轉碼芯片在保證高效率轉碼性能的同時,又能比GPU省下大半的成本,還可以針對性地提供附加服務,比如音畫質增強、內容分析理解和實時渲染等等。至于目前大熱的AI推理,目前騰訊云的滄海還未公開投入使用,不過騰訊云已經透露用于內部業務中。
寫在最后
歸根結底,在云服務廠商之間激烈的競爭下,自研芯片只是他們提升競爭力的一種手段罷了。在AI熱潮尚未平復下來之前,他們依然會繼續持續采購英偉達的GPU,提供高性能的AI推理和訓練方案。在這樣的趨勢下,如何確定芯片的定位是每一個走上自研道路的云服務廠商必須思考的問題。
-
云服務
+關注
關注
0文章
828瀏覽量
38953 -
亞馬遜
+關注
關注
8文章
2671瀏覽量
83457
發布評論請先 登錄
相關推薦
評論