在大咖云集的亞馬遜云科技re:Invent 2023全球大會現場,大家最關注的焦點話題是什么?
對于這個問題,相信很多人都會不假思索地在第一時間給出答案——生成式AI。
然而生成式AI的應用以及大語言模型的訓練,都對算力有著極高的需求。身為全球云計算開拓者和領軍者,亞馬遜云科技認為這意味著怎樣的機遇?同時又帶來了怎樣的挑戰?企業可以通過生成式AI實現怎樣的轉型升級?為了滿足客戶的迫切需求,亞馬遜云科技又提供了怎樣的解決方案?
生成式AI帶來的機遇與挑戰
“生成式AI帶來的機遇非常明顯,對吧?大家都已經有目共睹?!眮嗰R遜云科技計算和網絡副總裁David Brown向趣味科技表示,“我們希望亞馬遜云科技能夠成為運行這些工作負載的最佳場所,并且已經為此投入了大量資金和資源?!?/p>
David Brown指出,生成式AI的發展帶來了極其廣袤的市場,通過與NVIDIA等合作伙伴的攜手合作,以及自研的Amazon Graviton和Amazon Trainium系列定制芯片,亞馬遜云科技正在努力為客戶提供更好的性價比,希望能夠幫助客戶以更低的成本引入和運行他們的模型。
而在挑戰方面,如何幫助客戶理解生成式AI,以及如何利用生成式AI為客戶的業務服務,是當下生成式AI應用的難點,也是亞馬遜云科技一直在努力的事情。在探索與試驗的過程中,亞馬遜云科技很快意識到,在Amazon Bedrock模型中為客戶提供選擇是正確的做法。為此亞馬遜云科技在re:Invent 2023全球大會上宣布推出Amazon Bedrock更多模型選擇和強大功能,讓用戶可輕松訪問來自AI21 Labs、Anthropic、Cohere、Meta、Stability AI以及亞馬遜的多種行業領先的大語言模型和其他模型,從而幫助企業更加輕松地構建適合自身業務的定制化生成式AI應用,極大地降低了生成式AI應用的門檻。
當前面臨的另一項挑戰,是如何確保在客戶需要時提供足夠的GPU算力。為此亞馬遜云科技一邊持續在全球范圍內構建數據中心和電力足跡,一邊開展了多項技術和服務創新,包括推出Capacity Blocks服務,使得即使是在供應受限的環境中,也能夠幫助客戶找到電源、GPU和加速器,獲得GPU訪問權限,從而支持他們的生成式AI工作負載。
努力為客戶提供更好性價比
強大的算力自然離不開強勁的芯片。在這方面,亞馬遜云科技主要是通過兩種方式來實現自己的目標。
一種方式是與NVIDIA的緊密合作。亞馬遜云科技與NVIDIA攜手進行了大量投資,將最新的NVIDIA GPU引入亞馬遜云科技。繼成為全球首家提供NVIDIA GH100 Grace Hopper數據中心GPU訪問的云服務商之后,NVIDIA創始人、CEO黃仁勛又在re:Invent 2023全球大會現場宣布,亞馬遜云科技成為全球首家推出NVIDIA GH200 NVL32實例的云服務商。
“在數據中心運行NVIDIA GPU的工作非常具有挑戰性,工程設計非常困難,需要世界上最好的供應商才能做好這些事情。”David Brown表示,“我認為在這方面,亞馬遜云科技確實比其他任何公司都要出色?!?/p>
另一種方式是投資和設計自己的定制芯片。在re:Invent 2023全球大會上,亞馬遜云科技就宣布其自研芯片家族推出Amazon Graviton4和Amazon Trainium2等新一代產品,為生成式AI應用和機器學習訓練等廣泛的工作負載提供了更高的性價比和能效。其中Graviton4較上一代產品性能提升30%,獨立核心增加50%以上,內存帶寬提升75%以上;Trainium2較上一代產品訓練速度提升4倍,能效提升2倍,并能在EC2 UltraClusters中部署多達100,000個芯片。
“芯片是用戶所有工作負載的基礎,如果你是一個希望運行生成式AI工作負載的客戶,你自然會選擇性價比最高、對自己來說最合理的芯片。”David Brown表示,“亞馬遜云科技每一代自研芯片都持續提升性價比和能效,為客戶提供了基于AMD、Intel以及NVIDIA等的最新芯片和實例組合之外的更多選擇,這使得Amazon EC2可以為客戶虛擬運行幾乎所有應用和工作負載,同時也為客戶提供了更好的性價比?!?/p>
利用生成式AI助力企業轉型
如今越來越多的企業都對生成式AI投入了更多的關注。如何將生成式AI技術應用到自身業務,如何實現降本增效,如何為公司帶來價值,也成為了廣大企業正在努力研究的課題。
“生成式AI太新了,許多客戶都在努力研究如何將這一技術應用到自己的業務當中。我真正需要思考的主要是兩件事?!盌avid Brown說道。
第一件事,是企業如何利用生成式AI的能力,并想出用這些能力為最終用戶構建什么?David Brown認為這是每家企業都在考慮的事情,實際上在亞馬遜云科技內部,就有團隊通過機器學習實驗室與客戶合作,幫助他們構建概念證明,以實際測試生成式AI可以為客戶業務做些什么。目前在幫助客戶構建生成式AI解決方案方面,亞馬遜云科技已經取得了很大的成功。
第二件事,是一旦企業有了一個生成式AI解決方案,那么就必須確保公司盈虧能夠負擔得起它的運行成本。因為如果運行成本太高的話,企業實際上是無法實施部署的。因此亞馬遜云科技所做的就是幫助客戶找到成本優化的方法。無論是改進開發模型的方式,還是通過像Trainium這樣的自研芯片,亞馬遜云科技都希望能夠真正降低生成式AI應用的成本。
在re:Invent 2023全球大會上,亞馬遜云科技數據與機器學習副總裁Swami Sivasubramanian博士在主題演講中重點介紹了亞馬遜云科技推出的生成式AI技術堆棧。該堆棧包括了底層負責訓練和推理的基礎設施層、中間微調模型需求的工具服務層、上層構建生成式AI應用層等三個重要層級。通過對這三個層級的不斷重構,亞馬遜云科技能夠為客戶提供更具性價比和安全性的技術與服務,從而利用生成式AI更好地助力企業轉型升級。
摩爾定律失效但芯片仍在進步
說起芯片,很多人都會想起英特爾創始人之一戈登·摩爾多年前提出的大名鼎鼎的“摩爾定律”,也就是集成電路芯片上可容納的晶體管數目,大約每隔18個月便會增加一倍。
在上個世紀,摩爾定律被證明是有效的,并且著實推動了芯片市場的進步。然而近年來,由于晶體管尺寸和制造工藝的限制,摩爾定律也日益逼近極限。NVIDIA CEO黃仁勛就認為,這種蠻力增加晶體管的方法基本上已經走到了盡頭,從而引發了眾多業界人士有關“摩爾定律是否已死”的爭論。
“摩爾定律的爭論非常有趣,如果我們回到上個世紀,有時會看到英特爾工程師們在為如何讓下一版CPU晶體管數量翻倍而絞盡腦汁,有時又會看到他們已經實現了晶體管翻倍,反而要為下一代產品故意做一些保留。”談起摩爾定律的話題,David Brown如是表示,“但是令人驚訝的是,在幾十年后的今天,我們似乎已經看到了摩爾定律的極限,因為現階段物理問題的限制,我們在技術上已經無法再使CPU上的晶體管數量在短期內實現翻倍。”
David Brown指出,事實上除了增加晶體管的數量之外,還有各種各樣的其他方法可以提升芯片的性能,包括改變設計芯片的方式,改變構建芯片的方式,改變為芯片提供能量的方式等等。因此即便是摩爾定律失效,也并不意味著芯片不會繼續創新和提高性能。這就是Amazon Graviton和Amazon Trainium系列芯片向其他芯片制造商展示的意義所在。
審核編輯:黃飛
-
摩爾定律
+關注
關注
4文章
636瀏覽量
79134 -
NVIDIA
+關注
關注
14文章
5053瀏覽量
103364 -
AI
+關注
關注
87文章
31287瀏覽量
269643 -
亞馬遜
+關注
關注
8文章
2673瀏覽量
83459 -
AI算力
+關注
關注
0文章
73瀏覽量
8782
原文標題:生成式AI算力如此緊張,怎樣選擇才最劃算
文章出處:【微信號:funnytechnology,微信公眾號:趣味科技v】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論