在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ChatGPT背后的經濟賬

OSC開源社區 ? 來源:OneFlow ? 2023-02-16 11:35 ? 次閱讀

ChatGPT能否取代Google、百度這樣的傳統搜索引擎?為什么中國不能很快做出ChatGPT?當前,對這些問題的探討大多囿于大型語言模型(LLM)的技術可行性,忽略或者非常粗糙地估計了實現這些目標背后的經濟成本,從而造成對LLM的開發和應用偏離實際的誤判。

本文作者從經濟學切入,詳細推導了類ChatGPT模型搜索的成本、訓練GPT-3以及繪制LLM成本軌跡的通用框架,為探討LLM成本結構和其未來發展提供了可貴的參考視角。

重點概覽:

LLM驅動的搜索已經在經濟上可行:粗略估計,在現有搜索成本結構的基礎上,高性能LLM驅動搜索的成本約占當下預估廣告收入/查詢的15%。

但經濟可行并不意味著經濟合理:LLM驅動搜索的單位經濟性是有利可圖的,但對于擁有超1000億美元搜索收入的現有搜索引擎來說,添加此功能可能意味著超100億美元的額外成本。

其他新興的LLM驅動業務利潤很高:比如Jasper.ai使用LLM生成文案,很可能有SaaS服務那樣的毛利率(超75%)。

對于大公司而言,訓練LLM(即使是從頭開始)的成本并不高:如今,在公有云中訓練GPT-3僅需花費約140萬美元,即使是像PaLM這樣最先進的模型也只需花費約1120萬美元。

LLM的成本可能會顯著下降:自GPT-3發布的兩年半時間里,與GPT-3性能相當的模型的訓練和推理成本下降了約80%。

數據是LLM性能的新瓶頸:與增加高質量訓練數據集的大小相比,增加模型參數的數量能獲得的邊際收益越來越小。

1 動機

LLM的驚人表現引發了人們的廣泛猜想,這些猜想主要包括LLM可能引發的新興商業模式和對現有模式的影響。

搜索是一個有趣的機會,2021年,僅谷歌就從搜索相關的廣告中獲得了超1000億美元的收入[1]。ChatGPT(一個使用LLM的聊天機器人,它可以生成高質量的答案,以回答類似于搜索的查詢)的“病毒性”傳播已經引發了許多關于搜索領域潛在影響的思考,其中一個就是LLM如今的經濟可行性:

一位聲稱是谷歌員工的人在HackerNews上表示,要想實施由LLM驅動的搜索,需要先將其成本降低10倍。

與此同時,微軟預計將在3月份推出LLM版本的Bing[3],而搜索初創公司如You.com已經將該技術嵌入到了他們的產品之中[4]。

最近,《紐約時報》報道,谷歌將在今年推出帶有聊天機器人功能的搜索引擎[5]。

更廣泛的問題是:將LLM納入當前產品和新產品的經濟可行性如何?在本文中,我們梳理了當今LLM的成本結構,并分析其未來可能的發展趨勢。

2 重溫LLM工作原理

盡管后續章節的技術性更強,但這篇文章對機器學習熟悉程度不做要求,即使不熟悉這方面內容的人也可以放心閱讀。為了說明LLM的特殊之處,現做一個簡要復習。

語言模型在給定上下文的情況下,對可能輸出的token作出預測:

6171e66c-ad33-11ed-bfe3-dac502259ad0.jpg

自回歸語言模型(Autoregressive Language Model)輸入上下文和輸出內容的圖示(在實踐中,token通常是子詞:即“happy”可能被分解為兩個token,例如“hap”、“-py”)

為了生成文本,語言模型根據輸出token的概率重復采樣新token。例如,在像ChatGPT這樣的服務中,模型從一個初始prompt開始,該prompt將用戶的查詢作為上下文,并生成token來構建響應(response)。新token生成后,會被附加到上下文窗口以提示下一次迭代。

語言模型已經存在了幾十年。當下LLM性能的背后是數十億參數的高效深度神經網絡(DNN)驅動。參數是用于訓練和預測的矩陣權重,浮點運算(FLOPS)的數值通常與參數數量(parameter count)成比例。這些運算是在針對矩陣運算優化的處理器上計算的,例如GPU、TPU和其他專用芯片。

隨著LLM參數量呈指數增長,這些操作需要更多的計算資源,這是導致LLM成本增加的潛在原因。

3 LLM驅動搜索的成本

本節,我們將估算運行LLM驅動搜索引擎的成本。應該如何實施這樣的搜索引擎仍是一個活躍的研究領域,我們這里主要考慮兩種方法來評估提供此類服務的成本范圍:

ChatGPT Equivalent:一個在龐大訓練數據集上訓練的LLM,它會將訓練期間的知識存儲到模型參數中。在推理過程中(使用模型生成輸出),LLM無法訪問外部知識[6]。

這種方法有如下兩大缺點:

容易“幻想”事實。

模型知識滯后,僅包含最后訓練日期之前的可用信息

2-Stage Search Summarizer:一種架構上類似的LLM,可以在推理時訪問Google或Bing等傳統搜索引擎。在這種方法的第一階段,我們通過搜索引擎運行查詢以檢索前K個結果。在第二階段,通過LLM運行每個結果以生成K個響應,該模型再將得分最高的響應返回給用戶[7]。

相比ChatGPT Equivalent,這種方法的優點是:

能夠從檢索到的搜索結果中引用其來源。

能獲取最新信息。

然而,對于相同參數數量的LLM,這種方法需要更高的計算成本。使用這種方法的成本也增加了搜索引擎的現有成本,因為我們在現有搜索引擎的結果上增加了LLM。

一階近似:基礎模型API

最直接的成本估算方法是參考市場上現有基礎模型API的標價,這些服務的定價包括成本的溢價部分,這部分是供應商的利潤來源。一個代表性的服務是OpenAI,它提供基于LLM的文本生成服務。

OpenAI的Davinci API由GPT-3的1750億參數版本提供支持,與支持ChatGPT的GPT-3.5模型具有相同的參數數量[8] 。現在用該模型進行推理的價格約為0.02美元/750個單詞(0.02美元/1000個token,其中1000token約等于750個單詞);用于計算定價的單詞總數包括輸入和輸出[9]。

6184c78c-ad33-11ed-bfe3-dac502259ad0.jpg

按模型功能劃分的基礎模型API定價 (OpenAI)

我們這里做了一些簡單假設來估計將支付給OpenAI的搜索服務費用:

在ChatGPT equivalent的實現中,我們假設該服務平均針對50字的prompt生成400字的響應。為了產生更高質量的結果,我們還假設模型對每個查詢采樣5個響應,從中選擇最佳響應。因此:

61991a70-ad33-11ed-bfe3-dac502259ad0.jpg

在2-Stage Search Summarizer的實現中,響應生成過程是相似的。然而:

提示明顯更長,因為它同時包含查詢和搜索結果中的相關部分

為每K個搜索結果生成一個單獨的LLM響應

假設K = 10并且搜索結果中的每個相關部分平均為1000個單詞:

61a9afa2-ad33-11ed-bfe3-dac502259ad0.jpg

假設優化的緩存命中率為30%(谷歌歷史搜索緩存命中率的下限[10])和OpenAI云服務的毛利率為75%(與典型的SaaS服務一致),我們的一階估計意味著:

61c39c50-ad33-11ed-bfe3-dac502259ad0.jpg

按照數量級,ChatGPT Equivalent服務的預計云計算成本為0.010美元/次,與公眾評論一致:

61db3a36-ad33-11ed-bfe3-dac502259ad0.jpg

OpenAI首席執行官Sam Altman談ChatGPT每次聊天的成本([推特](https://twitter.com/sama/status/1599671496636780546?lang=en)

鑒于ChatGPT Equivalent的上述缺點(即幻想事實、模型信息陳舊),在實際操作中,LLM驅動搜索引擎的開發者更可能部署2-Stage Search Summarizer變體。

2012年,谷歌搜索主管表示,其搜索引擎每月處理的搜索次數達1000億次[11]。世界銀行數據顯示:全球互聯網普及率已從2012年的34%上升到了2020年的60%[12]。假設搜索量按比例增長,則預計其年均搜索量將達2.1萬億次,與搜索相關的收入將達約1000億美元[13],平均每次搜索的收入為0.048美元。

換句話說,2-Stage Search Summarizer的查詢成本為0.066美元/次,約為每次查詢收入0.048美元的1.4倍。

通過以下優化,預估成本大約會降至原來的1/4:1、量化(使用較低精度的數據類型) 2、知識蒸餾(通過學習較大的模型去訓練一個較小的模型) 3、訓練更小的“計算優化”模型,該模型具有相同的性能(稍后將對此展開更詳細的討論)

假設云計算的毛利率約為50%,與依賴云服務提供商相比,運行自建(內部)基礎設施(infrastructure in-house)會使成本降低至當前的1/2。

綜合以上改進,降低至原有成本的1/8之后,在搜索中融入高性能LLM的成本大約占據當前查詢收入的15%(現有的基礎設施成本除外)。(注:成本最低可降至 0.066 美元/次 * 1/4 * 1/2, 約定于0.008美元,因此大約占每次查詢收入 0.048 美元的 15%)

深度解析:云計算成本

如今,SOTA大型語言模型通常會用到可比較的模型架構(最常見的是僅包含解碼器的Transformer模型),在推理過程中每個token的計算成本(以FLOPs為指標)約為2N,其中N為模型參數數量(model parameter count)[14]。

目前,NVIDIA A100是AWS最具成本效益的GPU選擇,若預定1年使用該GPU,擁有8個A100的AWS P4實例的有效時薪(effective hourly rate)將達19.22美元。[15]每個A100提供峰值312 TFLOPS(萬億次浮點數/秒)FP16/FP32 混合精度吞吐量,這是LLM訓練和推理的關鍵指標[16]。FP16/FP32混合精度是指以16位格式(FP16)執行操作,而以32位格式(FP32)存儲信息。由于FP16的開銷較低,混合精度不僅支持更高的FLOPS吞吐量,而且保持精確結果所需的數值穩定性也會保持不變[17]。

假設模型的FLOPS利用率為21.3%,與訓練期間的GPT-3保持一致(雖然最近越來越多的模型效率得以提升,但其FLOPS利用率對于低延遲推理而言仍充滿挑戰)[18]。因此,對于像GPT-3這樣擁有1750億參數的模型:

61ec7878-ad33-11ed-bfe3-dac502259ad0.jpg

我們也應用了基于GCP TPU v4定價( GCP TPU v4 pricing)相同的計算方法,并得到了相似的結果[19]:

61fdfcce-ad33-11ed-bfe3-dac502259ad0.jpg

預估GPT-3通過云服務提供商 (AWS, GCP)每處理1000個token所需的推理成本

OpenAI的API定價為0.02美元/1000詞,但我們估計其成本約為0.0035美元/1000詞,占定價的20%左右。這就意味著:對于一臺一直運行的機器而言,其毛利率約為80%。這一估算與我們之前設想的75%毛利率大致相同,進而為ChatGPT Equivalent和2-Stage Search Summarizer搜索成本估算提供了合理性驗證(sanity check)。

4 訓練成本如何?

另一個熱門話題是GPT-3(擁有1750億參數)或最新的LLM(如擁有2800億參數的Gopher和擁有5400億參數的PaLM)的訓練成本。基于參數數量和token數量,我們構建了一個用于估算計算成本的框架,雖然稍作修改,但同樣適用于此:

每個token的訓練成本通常約為6N(而推理成本約為2N),其中N是LLM的參數數量[20]

假設在訓練過程中,模型的FLOPS利用率為46.2% (而在之前的推理過程中,模型的FLOPS利用率約為21.3%),與在TPU v4芯片上進行訓練的PaLM模型(擁有5400億參數)一致[21]。

1750億參數模型的GPT-3是在3000億token上進行訓練的。谷歌使用了GCP TPU v4芯片來訓練PaLM模型,若我們現在也像谷歌那樣做,那么如今的訓練成本僅為140萬美元左右。

620ce8c4-ad33-11ed-bfe3-dac502259ad0.jpg

此外,我們還將該框架應用到一些更大的LLM模型中,以了解其訓練成本。

621b94b4-ad33-11ed-bfe3-dac502259ad0.jpg

預估LLM在GCP TPU v4芯片上的訓練成本

5 繪制成本軌跡的通用框架

為了推導LLM的推理成本/訓練成本,我們總結了如下框架:

623174dc-ad33-11ed-bfe3-dac502259ad0.jpg

密集激活純解碼器LLM模型Transformer(Densely Activated Decoder-Only Transformer LLMs)的推理成本和訓練成本(其中“N”是模型參數數量,“processor”是指TPU、GPU或其他張量處理加速器)

因此,我們假設LLM的架構相似,那么推理成本和訓練成本將根據上述變量的變化而變化。雖然我們會詳細考慮每個變量,但是以下部分才是關鍵點:

自2020年GPT-3發布以來,使用與GPT-3一樣強大的模型進行訓練和推理的成本大大降低,低于先前的五分之一。

6248399c-ad33-11ed-bfe3-dac502259ad0.jpg

相比2020年推出的GPT-3,與其性能對等的模型的推理與訓練成本降低情況總結

參數數量效率:巨型語言模型參數每年增長10倍的神話

考慮到過去5年中模型參數呈指數增長,我們普遍猜測:下一代LLM模型很可能是萬億參數(密集激活)模型:

625b3344-ad33-11ed-bfe3-dac502259ad0.jpg

LLM中模型參數數量的增長

雖然LLM的參數數量每年約增長10倍,但是大多數模型訓練數據集的大小并沒有顯著變化:

626bb188-ad33-11ed-bfe3-dac502259ad0.jpg

所選LLM的模型參數數量與訓練token數量 (訓練計算最優大語言模型)

然而,最新文獻表明,假設計算資源和硬件利用率(即訓練“計算最優”模型)保持不變,關注擴展參數數量(scaling parameter count)并不是性能最大化的最佳方式:

627f2484-ad33-11ed-bfe3-dac502259ad0.jpg

Google DeepMind的研究人員將一個參數函數(parametric function)擬合到他們的實驗結果中,發現參數數量N的增速應與訓練token數量D的增長速度大致相同,從而讓模型損失L實現最小化(即性能最大化):

6290147e-ad33-11ed-bfe3-dac502259ad0.jpg

模型損失的參數函數 (訓練計算最優大語言模型)

研究人員還訓練了一個名為Chinchilla的模型(擁有700億的參數)。雖然該模型的計算資源與Gopher(擁有2800億參數)相同,但是該模型是在1.4萬億token上進行訓練的而非3000億token。Chinchilla的性能明顯優于擁有相同FLOPs預算的大型模型,從而證明了大多數LLM過度支出了計算量和對數據的渴望 (譯者注:換言之,對大多數LLM來說,使用更多的數據來訓練比增大模型參數量要更加劃算)。

62a32d52-ad33-11ed-bfe3-dac502259ad0.jpg

通過訓練數據大小與模型參數來預測模型損失(錯誤更少:Chinchilla的自然環境含義)

雖然Chinchilla的參數(以及推理計算需求)比GPT-3少60%,但是其性能遠遠優于擁有1750億參數的GPT-3模型。

實際上,即使我們用與GPT-3相同的3000億token數據集去訓練一個萬億參數模型,仍可以預見該模型的表現不如Chinchilla:

62b7df68-ad33-11ed-bfe3-dac502259ad0.jpg

萬億參數模型相應損失項的相對量級(0.03的模型參數損失與0.25的訓練token損失)也表明,通過增加模型大小獲得的邊際效益低于增加數據量獲得的邊際效益。

展望未來,我們不會繼續擴大模型參數數量,而是將增量計算資源(incremental computational resources)轉移到質量相當的更大數據集上進行訓練,以獲得極佳的性能。

Cost/FLOP效率

對于訓練LLM而言,最重要的硬件性能指標(hardware performance metric)是可實現的混合精度FP16/FP32 FLOPS。改進硬件旨在實現成本最小化,同時使得峰值FLOPS吞吐量和模型FLOPS利用率實現最大化。

雖然這兩個部分在硬件開發中密不可分,但為了讓分析變得更簡單,本節重點關注吞吐量,下一節再討論利用率。

62c6b1aa-ad33-11ed-bfe3-dac502259ad0.jpg

目前,我們已經通過查看云實例定價(cloud instance pricing)估算了Cost/FLOP效率。為了進行下一步探究,我們估算了運行以下機器的成本。主要包括以下兩個方面:1)硬件購買(hardware purchase) 2)能源支出(energy expense)。為說明這一點,我們再來看看GPT-3(一款由OpenAI推出的模型,該模型在Microsoft Azure的10000個V100 GPU上訓練了14.8天)[22]:

62daee18-ad33-11ed-bfe3-dac502259ad0.jpg

2020年用英偉達V100 GPU訓練GPT-3的成本(碳排放與大型神經網絡訓練)

黃仁勛定律(英偉達首席執行官黃仁勛于2018年提出)指出,在硬件成本方面,GPU的增長速度比五年前快了25倍[23]。在訓練LLM的背景下,GPU的性能得到了很大提升,這很大程度上得益于張量核心(Tensor Cores)(AMD采用的是矩陣核心(matrix cores))。此外,GPU不再將矢量作為計算原語,而是轉為矩陣,從而實現了性能更好、效率更高的混合精度計算。

2016年,NVIDIA通過V100數據中心GPU首次推出了張量核心。與最初引入的張量核心相比,雖然這一改進不太明顯,但是每一代張量核心都進一步提高了吞吐量。如今,對于用于訓練LLM的數據中心GPU,我們仍能看到每一代GPU的吞吐量都提升了50%(或者說年均吞吐量提升了22%左右)。

62f529fe-ad33-11ed-bfe3-dac502259ad0.jpg

數據中心GPU FP16/FP32吞吐量/美元 (NVIDIA)

63066fb6-ad33-11ed-bfe3-dac502259ad0.jpg

桌面GPU和數據中心GPU、按精度劃分的吞吐量/美元 (英偉達,深度學習推理中的計算和能源消耗趨勢)

能源效率提升得更快?,F在我們可以看到,用于訓練LLM的數據中心GPU的代際吞吐量/瓦特提高了80%(或者說年均吞吐量提高了34%):

6315c6d2-ad33-11ed-bfe3-dac502259ad0.jpg

數據中心 GPU FP16/FP32 吞吐量/瓦特 (英偉達)

632b11e0-ad33-11ed-bfe3-dac502259ad0.png

按精度劃分的桌面和數據中心GPU吞吐量/瓦特(英偉達,深度學習推理中的計算和能耗趨勢)

僅從V100(用于訓練 GPT-3)到即將推出的H100的改進來看,我們預計內部訓練成本將降低58%(即訓練成本由74.4萬美元降低到31.2萬美元)。

634ad5e8-ad33-11ed-bfe3-dac502259ad0.jpg

目前使用英偉達H100 GPU訓練GPT-3的成本

展望未來,我們預測,隨著硬件設計的不斷創新,硬件成本和能效將逐步改進。例如,從V100到A100 GPU,NVIDIA添加了稀疏特性(sparsity features),這進一步將某些深度學習架構的吞吐量提高了2倍[24] 。NVIDIA正在H100中添加對FP8數據類型的本地支持,當與推理量化等現有技術相結合時,可以進一步提高吞吐量[25]。

此外,TPU和其他專用芯片的出現從根本上重塑了深度學習用例的芯片架構。谷歌的TPU建立在脈動陣列結構(systolic array architecture)之上,可顯著減少寄存器使用,提高吞吐量[26]。正如下一節將提到的,隨著我們將訓練和推理擴展到大型參數模型,最近許多硬件都著力于提高利用率。

硬件利用率提升

出于內存需求,LLM訓練的主要挑戰之一就是將這些模型從單個芯片擴展到多個系統和集群級別。在典型的LLM訓練中,設置保存優化器狀態、梯度和參數所需的內存為20N,其中N是模型參數數量[27]。

因此,BERT-Large(2018年早期的LLM之一,擁有3.4億參數)僅需6.8GB內存,就可輕松裝入單個桌面級GPU。另一方面,對于像GPT-3這樣的1750億參數模型,內存要求轉換為3.5TB。同時,NVIDIA最新的數據中心 GPU(H100)僅包含80GB的高帶寬內存(HBM),這表明至少需要44個H100才能滿足GPT-3的內存要求。[28]此外,即使在10000個V100 GPU上訓練GPT-3也需要14.8天。

因此,即使我們增加用于訓練的芯片數量,FLOPS利用率也仍然需要保持高水平,這一點至關重要。

6360b7c8-ad33-11ed-bfe3-dac502259ad0.jpg

硬件利用率的第一個維度是在單芯片層面。在單個A100 GPU上訓練GPT-2模型時,硬件利用率達35.7%[29]。事實證明,片上內存(on-chip memory)和容量是硬件利用的瓶頸之一:處理器內核中的計算需要重復訪問HBM,而帶寬不足會抑制吞吐量。同樣,有限的本地內存容量會迫使從延遲較高的HBM進行更頻繁的讀取,從而限制吞吐量[30]。

硬件利用率的第二個維度與芯片到芯片的擴展有關。訓練像GPT-3這樣的LLM模型需要跨多個GPU對模型和數據進行劃分。正如片上存儲器的帶寬可能成為硬件利用的瓶頸一樣,芯片間互連的帶寬也可能成為硬件利用的限制因素。隨著V100的發布,NVIDIA的NVLink實現了每個GPU 300GB/s的帶寬。對于A100來說,寬帶速度實現了600GB/s[31]。

硬件利用率的最后一個維度是系統到系統的擴展。一臺機器最多可容納16個GPU,因此擴展到更多數量的GPU要求跨系統的互連不能成為性能瓶頸。為此,Nvidia的Infiniband HCA在過去3年中將最大帶寬提高了2倍[32]。

在第二和第三個維度上,軟件劃分策略是硬件有效利用的關鍵考慮因素。通過結合模型和數據并行技術,2022年使用MT-NLG的Nvidia芯片集群級別的LLM訓練的模型FLOPS利用率達到了30.2%[33],而使用GPT-3的模型FLOPS利用率在2020年只有21.3%:

63736044-ad33-11ed-bfe3-dac502259ad0.jpg

選擇LLM的模型FLOPS利用率(PaLM:使用路徑擴展語言建模)

TPU等專用硬件實現了更高的效率。

谷歌5400億參數的PaLM模型在TPU v4芯片上實現了46.2%的模型FLOPS利用率,是GPT-3訓練利用率的2.2倍[34]

FLOPS利用率的提高得益于更高效的并行訓練(使用Google的Pathways ML系統)以及從根本上TPU具有完全不同的架構。該芯片的脈動陣列結構和每個內核的顯著的本地內存密度(local memory density)降低了高延遲全局內存(global memory)的讀取頻率。

同樣地,我們可以看到Cerebras、Graphcore和SambaNova等公司在處理器中分配了更多的共享內存容量。展望未來,我們預計其他新興創新,例如將芯片擴展到晶圓級以減少延遲/增加帶寬,或通過可編程單元優化數據訪問模式等將進一步推動硬件利用率的發展[35]。

6 大型語言模型即將迎來全盛時期

據《紐約時報》近日報道,谷歌宣稱ChatGPT是其搜索業務的“紅色警報”( code red),它的搜索量呈病毒式發展。

[36]從經濟角度來看,通過粗略估算,將高性能LLM納入搜索將花費約15%的查詢收入,這表明該技術的部署已經切實可行。然而,谷歌的市場主導地位阻礙了它成為這方面的先行者:谷歌目前的搜索收入為1000億美元,將高性能LLM納入搜索會使谷歌的盈利能力減少一百多億美元。

另一方面,也就難怪微軟會計劃將大語言模型納入Bing了[37]。盡管LLM支持的搜索成本高于傳統搜索,并且與谷歌相比,微軟搜索引擎的市場份額要低得多,但是微軟并未虧損。因此,如果微軟能夠成功地從谷歌手中奪取搜索市場份額,那么即使現有查詢成本更高,微軟仍然能夠獲得極高的利潤。

有趣的是,對于其他產品,通過部署LLM已經可以通過SaaS來盈利。例如,最近估值為15億美元、使用LLM生成文案的Jasper.ai收費為82美元/100000字(相當于1.09美元/1000個token)[38]。使用OpenAI的Davinci API 定價為 0.02美元/1000個token,即使我們對多個響應(response)進行采樣,毛利率也可能遠高于75%。

同樣令人驚訝的是,如今在公有云中僅需約140萬美元即可對GPT-3進行訓練,而且即使是SOTA模型(如PaLM,約1120萬美元)的訓練成本也不會太高。在過去的兩年半里,類似GPT-3等模型的訓練成本下降了80%以上,高性能大語言模型的訓練成本將進一步降低。

換句話說,訓練大語言模型并不便宜,但也沒那么燒錢,訓練大語言模型需要大量的前期投入,但這些投入會逐年獲得回報。更近一步,Chinchilla論文表明,在未來,相比資金,高質量數據會成為訓練LLM的新興稀缺資源之一,因為擴展模型參數數量帶來的回報是遞減的。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4777

    瀏覽量

    100995
  • 機器學習
    +關注

    關注

    66

    文章

    8434

    瀏覽量

    132871
  • ChatGPT
    +關注

    關注

    29

    文章

    1566

    瀏覽量

    7886

原文標題:ChatGPT背后的經濟賬

文章出處:【微信號:OSC開源社區,微信公眾號:OSC開源社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ChatGPT新增實時搜索與高級語音功能

    在OpenAI的第八天技術分享直播中,ChatGPT的搜索功能迎來了重大更新。此次更新不僅豐富了ChatGPT的功能體系,更提升了其實用性和競爭力。 新增的實時搜索功能,是此次更新的亮點之一
    的頭像 發表于 12-17 14:08 ?245次閱讀

    OpenAI世界最貴大模型:昂貴背后的技術突破

    2023年“雙十二”的第一天,OpenAI推出了其最強推理模型o1的滿血版及其Pro版本。同時,ChatGPT也推出了每月200美元的Pro訂閱計劃,這一價格使其一躍成為“世界最貴的大模型”。下面,AI部落小編帶您深入了解OpenAI世界最貴大模型背后的故事。
    的頭像 發表于 12-06 14:46 ?503次閱讀

    OpenAI推出ChatGPT搜索功能

    近日,OpenAI再次邁出了重要的一步,為其廣受好評的ChatGPT平臺添加了一項全新的搜索功能。 據悉,這項被命名為“ChatGPT搜索”的新功能,將為用戶帶來前所未有的搜索體驗。以往,當用戶需要
    的頭像 發表于 11-04 10:34 ?379次閱讀

    ChatGPT:怎樣打造智能客服體驗的重要工具?

    ChatGPT作為智能對話生成模型,可以幫助打造智能客服體驗的重要工具。以下是一些方法和步驟:1.數據收集和準備:收集和整理與客服相關的數據,包括常見問題、回答示例、客戶對話記錄等。這將用于訓練
    的頭像 發表于 11-01 11:12 ?203次閱讀
    <b class='flag-5'>ChatGPT</b>:怎樣打造智能客服體驗的重要工具?

    怎樣搭建基于 ChatGPT 的聊天系統

    搭建一個基于ChatGPT的聊天系統是一個涉及多個步驟的過程,包括理解ChatGPT的API、設計用戶界面、處理數據和集成ChatGPT模型。以下是一個簡化的指南,用于創建一個基本的聊天系統。 1.
    的頭像 發表于 10-25 16:23 ?560次閱讀

    ChatGPT 適合哪些行業

    ChatGPT 是一種基于人工智能的自然語言處理技術,它能夠理解和生成人類語言。這種技術在多個行業中都有廣泛的應用潛力。以下是一些ChatGPT特別適合的行業,以及它在這些行業中可能的應用方式
    的頭像 發表于 10-25 16:11 ?486次閱讀

    如何使用 ChatGPT 進行內容創作

    使用ChatGPT進行內容創作是一個高效且富有創意的過程。以下是一些關鍵步驟和建議,幫助您充分利用ChatGPT進行內容創作: 一、準備階段 注冊與登錄 : 確保您已注冊ChatGPT賬號,并登錄
    的頭像 發表于 10-25 16:08 ?506次閱讀

    華納云:ChatGPT 登陸 Windows

    ChatGPT 現已在 Windows 上推出。 今天,OpenAI宣布已開始預覽其 AI 聊天機器人平臺ChatGPT的專用 Windows 應用程序。 OpenAI 表示, ChatGPT
    的頭像 發表于 10-18 15:50 ?261次閱讀

    ChatGPT背后的AI背景、技術門道和商業應用

    作者:京東科技 李俊兵 各位看官好,我是球神(江湖代號)。 自去年11月30日ChatGPT問世以來,迅速爆火出圈。 起初我依然以為這是和當年Transformer, Bert一樣的“熱點”模型
    的頭像 發表于 10-18 15:42 ?2155次閱讀
    <b class='flag-5'>ChatGPT</b><b class='flag-5'>背后</b>的AI背景、技術門道和商業應用

    用launch pad燒錄chatgpt_demo項目會有api key報錯的原因?

    我用launch pad燒錄chatgpt_demo項目問題會有api key報錯;請問用launch pad要如何設置api key和調試?還是只能通過idf?
    發表于 06-27 07:59

    使用espbox lite進行chatgpt_demo的燒錄報錯是什么原因?

    我使用espbox lite進行chatgpt_demo的燒錄 我的idf是v5.1release版本的,espbox是master版本的 在編譯時似乎沒有什么問題 在燒錄時報錯 請問這是什么原因
    發表于 06-11 08:45

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    當地時間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強大基礎上,這種迭代擁有顯著的改進。在發布會的演示中,OpenAI展示該模型的高級
    發表于 05-27 15:43

    在FPGA設計中是否可以應用ChatGPT生成想要的程序呢

    當下AI人工智能崛起,很多開發領域都可看到ChatGPT的身影,FPGA設計中,是否也可以用ChatGPT輔助設計呢?
    發表于 03-28 23:41

    如何在測試中使用ChatGPT

    Dimitar Panayotov 在 2023 年 QA Challenge Accepted 大會 上分享了他如何在測試中使用 ChatGPT
    的頭像 發表于 02-20 13:57 ?791次閱讀

    【國產FPGA+OMAPL138開發板體驗】(原創)6.FPGA連接ChatGPT 4

    OMAP-L138(定點/浮點DSP C674x+ARM9)+ FPGA處理器的開發板。 編寫一個用于FPGA訪問ChatGPT 4的程序代碼是一個相當復雜的任務,涉及到硬件設計、網絡通信、數據處理等多個
    發表于 02-14 21:58
    主站蜘蛛池模板: 69久久| 69女poren18中国| 日本a级片在线播放| 免费色黄网站| 国语一区| 性无码专区无码| 日本在线不卡一区二区| jinv在线视频| 大黄网站在线观看| www.午夜色| 粗又长好猛好爽| 天天色天天射综合网| 日韩欧美不卡片| 午夜乩伦| 伊人网网站| 美女扒尿口给男人桶到爽| 好硬好湿好爽再深一点h| 亚洲图色视频| 日本高清色视频在线观看免费| 美女免费视频色在线观看| 日韩精品午夜| 久久综合色婷婷| 久久精品夜色国产| 麦克斯奥特曼免费观看| 国产成人精品日本亚洲语言| 亚洲理论视频| 天天免费看片| 色综合视频| 欧美hh| 黄色视奸| 丁香激情小说| 在线久综合色手机在线播放| 在线亚洲综合| 日本在线播放一区| 成熟女人免费一级毛片| 天天干天| 黄h网站| 天堂中文字幕| 国产三级在线观看视频| 成年ssswww日本| 夜夜综合网|