最近,總部位于舊金山的人工智能初創公司 Inflection AI 在新一輪融資中籌集了 13 億美元,投資方包括微軟、英偉達和谷歌前首席執行官埃里克·施密特,這筆資金將支持 Inflection AI 的首款產品——名為Pi (Personal A.I)的個人助理和伴侶的進一步開發,該產品于 5 月推出。
此次融資使 Inflection 籌集的資金總額達到 15 億美元。該公司此前曾于 2022 年初從部分投資者那里籌集了 2.25 億美元,其中包括前 Meta 首席技術官 Mike “Schrep” Schroepfer、Google DeepMind 聯合創始人兼首席執行官 Demis Hassabis 以及流行藝術家Will.i.am。
Inflection 的目標是打造一種通用的人工智能數字助理。包括蓋茨在內的許多技術專家將這種助手視為所有人機交互的未來。
蓋茨在高盛表示:“無論誰贏得personal agent,這都是一件大事,因為你將永遠不會再去搜索網站,你永遠不會再去生產力網站,你永遠不會再去亞馬遜?!?就在幾周前,蓋茨參與了另一家“獨角獸”,即估值超過 10 億美元的人工智能初創公司的融資,加入了一群著名投資者的行列,向礦業初創公司KoBold Metals 注入資金。
Inflection 新一輪融資的規模反映出投資者對開創生成式 AI 的初創公司的熱情高漲,尤其是那些創建底層大語言模型 (LLM) 的公司,這些公司是當前 AI 熱潮的核心。近幾個月來,Cohere、Anthropic 和 Runway 等初創公司已宣布完成數億美元的融資。但 Inflection 的 10 億多美元資金也反映出創建這些人工智能模型的巨額費用,這些模型必須在大型數據中心的昂貴的專用計算機芯片上進行訓練。
英偉達創始人兼首席執行官黃仁勛在一份聲明中表示:“人工智能革命的一個強大好處是能夠使用自然的對話語言與超級計算機交互,以簡化我們日常生活的各個方面?!?“Inflection AI 的世界級團隊正在幫助領導這項開創性的工作,部署 Nvidia AI 技術來開發、訓練和部署大規模的生成式 AI 模型,從而實現令人驚嘆的個人數字助理?!?/p>
Inflection AI 由首席執行官 Mustafa Suleyman 共同創立,他還于 2012 年與 Hassabis 一起幫助創建了高級人工智能研究實驗室 DeepMind。谷歌于 2014 年以約 6.5 億美元收購了 DeepMind。Suleyman因被多名員工指控欺凌而于 2019 年從 DeepMind 離職,但后來短暫返回公司,然后加入谷歌擔任負責人工智能產品管理和政策的副總裁。隨后他于 2022 年離開谷歌,加入風險投資公司Greylock Partners,Inflection AI 的孵化地。Greylock 合伙人 Reid Hoffman 是PayPal和LinkedIn的聯合創始人,也是 OpenAI 的早期支持者,也是 Inflection 的聯合創始人。
許多風險投資家預測人工智能個人助理將融入日常生活。Andreessen Horowitz 的億萬富翁創始人馬克·安德森 (Marc Andreessen) 在一份 7000 字的宣言中寫道,像 Pi 這樣的聊天機器人有一天會普及到從創意藝術到政府的各個領域。
安德森在 6 月份寫道:“每個人都會有一位人工智能助理/教練/導師/培訓師/顧問/治療師,他們具有無限的耐心、無限的同情心、無限的知識和無限的幫助?!?“人工智能助手將伴隨生活中所有的機遇和挑戰,最大限度地提高每個人的成果?!?/p>
Inflection 的第一個產品是一個名為 Pi 的聊天機器人,它比這種精靈般的personal agent受到的限制要大得多。事實上,它比許多競爭的聊天機器人(例如 OpenAI 的 ChatGPT 和 Google 的 Bard)更加有限。Suleyman告訴《財富》雜志, Pi 的設計目的只是成為一個有同理心的傾聽者和良好的對話者,而不是一個用于撰寫研究報告、集思廣益營銷想法或編寫軟件代碼的工具——所有這些任務都是聊天機器人可以執行的。
Suleyman在Collision 直播中表示:“我認為每個人的口袋里都會有一位知識淵博、友善、樂于助人且非常務實的參謀長?!?“沒有任何人可以在一次經歷和一個人中同時完成所有這些技能......它將是參謀,它將是紅顏知己,它將是參謀長,它將是教練,它將是教育家和教師,合二為一?!?/p>
“個人人工智能將成為我們一生中最具變革性的工具。這確實是一個拐點,”Suleyman指出?!拔覀兒芨吲d能與 Nvidia、Microsoft 和 CoreWeave 以及 Eric、Bill 和其他許多人合作,將這一愿景變為現實。”
Inflection 表示,Pi 是“老師、教練、知己、創意合作伙伴和參謀”,其主要作用在于隨時準備好與用戶進行現場對話。
三位著名的創始人
Inflection AI 擁有三位著名的創始人,至少根據 Crunchbase 上的資料顯示,還有第四位聯合創始人,他似乎在人工智能領域的重要公司工作,但其網站上沒有透露他的身份,就像他沒有被確定為 OpenAI 的聯合創始人成員之一一樣。這個人—— Carlos Virella——沒有太多的痕跡,據我們所知,可能是阿甘正傳式的諷刺。但 Inflection AI 的其他三位創始人——其中一位也是 OpenAI 的聯合創始人——被曝光。這三者都與 Web 2.0 初創社區息息相關,是十年前開始的人工智能革命的重要組成部分,兩者的結合是 Inflection AI 推出名為 Pi 的個人人工智能服務的原因。
里德·霍夫曼 (Reid Hoffman) 是眾所周知的 LinkedIn 企業網絡聯合創始人之一,當在線拍賣商 eBay 于 2002 年 8 月斥資 15 億美元收購在線支付處理商 PayPal 時,他開始成為硅谷的一員。1998 年 12 月,一家名為 Confinity 的公司成立時,他擔任該公司的董事,并于 2000 年 1 月被任命為執行副總裁,負責該公司的所有對外關系。三個月后,Confinity 與另一家名為 X.com 的公司合并。埃隆·馬斯克 (Elon Musk) 是后者的聯合創始人,彼得·蒂爾 (Peter Thiel) 是前者的聯合創始人,2002 年 2 月,PayPal 上市,籌集了 6100 萬美元,成為互聯網泡沫破滅期間為數不多的亮點之一。因此,僅僅六個月后,eBay 就完成了收購。
2003 年 1 月,霍夫曼與他人共同創立了 LinkedIn,并擔任董事長兼首席執行官,并開始運營其產品,并于 2009 年秋季成為 Greylock Partners 的合伙人。2016 年 6 月,微軟斥資 262 億美元收購 LinkedIn,霍夫曼是控股股東,他自己在這筆交易中賺取了 28.4 億美元?;舴蚵F在仍在 Greylock,但他的個人資金以及微軟聯合創始人比爾·蓋茨、前 Sun Microsystems 和谷歌高管埃里克·施密特、Nvidia 和微軟以及小型 GPU 計算云構建專家CoreWeave的投資正在幫助資助 Inflection AI?;舴蚵?OpenAI 和微軟的董事會成員,由于與 Inflection AI 存在利益沖突,他于 3 月份辭去了 OpenAI 的職務。鑒于這家軟件巨頭與 OpenAI 的緊密合作關系,很難相信霍夫曼會在微軟董事會任職更長時間,但話又說回來,微軟正在投資 Inflection AI,作為一種對沖。因此,也許存在太多的利益沖突,它們就像雙重否定一樣相互抵消。
Inflection AI 首席科學家 Karén Simonyan 和首席執行官 Mustafa Suleyman 都是人工智能領域的長期研究人員,他們創建并出售了成功的公司。
Simonyan 于 2013 年在牛津大學創建了 VGGNet 圖像處理框架,該框架通過一家名為 Vision Factory AI 的公司進行了商業化,并很快被一家名為 DeepMind Technologies 的神秘人工智能初創公司收購,Simonyan 成為該公司的首席研究科學家。DeepMind 成立于 2010 年 6 月,Suleyman 擔任首席產品官,隨后 Google 進入該領域,并在 DeepMind 收購 Vision Factory 后不久收購了 DeepMind。Facebook(當時還不叫 Meta Platforms)曾在 2013 年試圖收購 DeepMind,谷歌為 DeepMind 的強化學習人工智能技術支付了 4 億到 6.5 億美元之間的費用。
如果你想追蹤其中的聯系,Suleyman 自 2022 年 1 月以來一直是 Greylock 的合作伙伴,很容易看出 Hoffman 和 Suleyman 在走廊里炮制了 Inflection AI。2022 年 5 月,當微軟、霍夫曼、蓋茨和施密特以及 Mike Schroepfer、Demis Hassabis、Will.i.am、Horizons Ventures 和 Dragoneer 共同投資時,Greylock 是 Inflection AI 籌集 2.25 億美元資金時的主要投資者。6 月底,Inflection AI 籌集了第二筆 13 億美元的資金,Nvidia 和 CoreWeave 成為新投資者。
人工智能正處于拐點
Inflection AI 的目標是讓地球上的每個人都可以使用其 Pi(personal intelligence 的縮寫)人工智能助手。考慮到運行LLM來回答愚蠢問題的高昂成本,計算這樣的努力需要多少計算能力以及如何負擔得起,這將是很有趣的。但暫時把它放在一邊。
為了實現這一目標,Inflection AI 做了三件事:擁有懂得如何做人工智能的聯合創始人、擁有大筆資金的聯合創始人、擁有大筆資金的朋友以及有通過人工智能致富的雄心的聯合創始人。因此,Inflection AI 建立了自己的 LLM(第一個迭代稱為 Inflection-1),并且像 OpenAI 一樣,將在必要的硬件上投入大量資金,以提高該模型的準確性并將其擴展到更大的數量。Pi 服務的用戶數量。
考慮到用于訓練LLM的計算引擎的高昂成本,這將需要大量資金。因此他們六月份大幅提升指出。
Inflection AI 與 Nvidia 和 CoreWeave 合作,在其 Inflection-1 LLM 上(跨越 3,500 個 Hopper GPU)在 11 分鐘內運行了 MLPerf 參考訓練基準。我們不知道有多少 GPU 用于訓練支撐 Pi 服務的 Inflection-1 模型,但它的數量可能比這個還要多,而且如果我們不得不猜測的話,它可能使用 Nvidia“Ampere”A100 GPU 加速器。
我們所知道的是,Nvidia 和 CoreWeave 正在合作在云中創建一個 AI 集群,該集群將擁有超過 22,000 個 H100 GPU 加速器,用于訓練我們認為將是 Inflection-2 LLM 的人員。Inflection AI 宣稱,這 22,000 個 H100 GPU 將“在 16 位精度調制解調器中提供驚人的 22 exaflops,如果使用較低的精度,甚至會更高”,并接著說,如果完成了高性能 Linpack (HPL) 矩陣數學測試放在上面,就像一臺HPC超級計算機一樣,它會在當前的Top500排行榜上排名第二,但在El Capitan和Aurora全面上線后可能會跌至第四。
如果您使用 Hopper PCI-Express 卡對 22,000 個 GOPU 加速器進行計算,超大規模提供商和云構建者通常使用這些卡來創建集群,而不是在四個或八個 GPU 的集群之間使用 NVLink Switch 互連的 HGX 式板并使用 Hopper GPU 的 SXM5 變體,然后在 Tensor Core 矩陣數學引擎上以 FP16 精度,在沒有稀疏性支持的情況下獲得 16.9 exaflops,在打開稀疏性支持的情況下獲得 33.8 exaflops。您還可以使用 H100 上的 FP64 雙精度矢量數學單元獲得額定為 572 petaflops 的集群。這與 Inflection AI 在其公告中談論的 FP16 精度的 22 exaflops 不符。
這就是有趣的地方。如果您對服務器機箱內將使用 NVLink Switch 互連的 22,000 個 H100 SXM5 GPU 加速器進行計算,那么您將得到一個集群,在 FP16 精度下,在未激活稀疏性的情況下,聚合峰值性能為 21.8 exaflops。(這可能會告訴您有關 Inflection-1 LLM 的一些信息,因為它可能不會使用大量稀疏數據。)這四舍五入為 Inflection AI 所說的 22 exaflops,這也產生了一臺峰值為 748 petaflops 的超級計算機FP64 矢量性能和 1.47 exaflops(FP64 在 Tensor Cores 矩陣引擎上運行)。(據我們所知,沒有很多 HPC 應用程序已移植到 Tensor Core。)
假設 Linpack 基準測試的計算效率為 65%,則該集群在 Top500 排名中的評級為 486 petaflops 左右,這將使其略高于日本 RIKEN 實驗室“Fugaku”超級計算機的 442 petaflops 評級,后者在 2017 年排名第二。遠低于目前排名第一的美國橡樹嶺國家實驗室“Frontier”超級計算機 1.19 exaflops 的性能。阿貢國家實驗室的“Aurora A21”系統預計將在今年晚些時候使用英特爾 CPU 和 GPU 交付時達到 2 exaflops 峰值,勞倫斯利弗莫爾國家實驗室的“El Capitan”系統也將在今年晚些時候推出將遠高于 2 exaflops 峰值。
這提出了一個重要的觀點。對于要考慮將云計算機與本地計算機進行比較的情況,您必須讓它始終為單個客戶運行。我們認為 Inflection AI 機器也會出現這種情況,甚至有可能該公司會在其上運行 Linpack,只是為了表明自己的觀點,并在 11 月份真正進入 Top500 榜單。但是,如果 Inflection AI 沒有幾乎連續地使用機器——我們想說的是絕對連續地使用機器,就像世界 HPC 實驗室的機器一樣,但也許說 75% 或 80% 的時間就足夠了——那么它不應該被算作本身就是一臺獨特的機器。
這將我們引向下一點。如此大量的容量需要花費多少錢?讓我們從使用 H100 PCI-Express 卡的集群開始嘗試一下。假設這些 H100 PCI-Express 卡的價格約為 20,000 美元,按我們認為接近當前市場價格計算,即 4.4 億美元。需要 2,750 個節點來容納所有這些 GPU,每個機箱有 8 個。配備一對強大的 CPU、2 TB 內存和用于數據和操作系統存儲的 34.5 TB NVM-Express 閃存(總共十個驅動器,兩個用于操作系統的skinny驅動器),每個驅動器的運行成本可能約為 150,000 美元。另外還有 4.125 億美元。正如 Nvidia 喜歡說的那樣,InfiniBand 網絡是另外 20%,即 2.13 億美元,這使其達到 10.7 億美元。
現在,讓我們看看 SXM 設置。同樣是 2,750 個節點,但這次 GPU 的成本可能約為 30,000 美元,因此 22,000 個節點的成本為 6.6 億美元。這些節點在機箱內的 NVLink Switch 成本還有 25,000 美元左右,機箱外的 InfiniBand 成本也有 2.13 億美元左右。現在您的資產達到 13.5 億美元。這看起來就像 Inflection AI 正在討論的使用 CoreWeave 和 Nvidia 構建的集群的場景。
這比美國政府為其百億億級超級計算機投入的資金要多得多,美國政府按標價計算的成本約為 5 億至 6 億美元,加上一次性工程 (NRE) 成本。
云開銷(包括系統管理、房地產和電力成本)很容易再增加 2 億美元,加上 CoreWeave 約 5% 的利潤率,成本將增加至 16.3 億美元。這略高于 Inflection AI 迄今為止從投資者那里籌集的 15.3 億美元。幸運的是,有了云,它不必像巨大的預留實例那樣一次性全部支付?;蛘?,也許確實如此,這就是為什么價格不會高于這個。(你能想象為這樣一個集群按需付費嗎?)
Pi 訂閱的價格是多少?需要有多少用戶以及多快才能支付費用?比爾蓋茨有足夠的錢,不必關心,英偉達和微軟也是如此。也許里德·霍夫曼也是。但您可以放心,所有這些數學計算都已完成。
-
人工智能
+關注
關注
1793文章
47535瀏覽量
239316 -
語言模型
+關注
關注
0文章
533瀏覽量
10303 -
英偉達
+關注
關注
22文章
3824瀏覽量
91558
原文標題:用22000個英偉達H100入局AI,初創企業的豪賭
文章出處:【微信號:semiwebs,微信公眾號:芯通社】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論