盛世嫡妃凤轻小说,魔天记忘语小说,盗墓笔记有声小说

今天，OpenAI發(fā)布了一份關(guān)于AI計算能力增長趨勢的分析報告，報告顯示：自2012年以來，AI訓(xùn)練中所使用的計算力每3.5個月增長一倍，自2012年以來，這個指標(biāo)已經(jīng)增長了30萬倍以上。

推動人工智能發(fā)展的因素有三個：算法創(chuàng)新、數(shù)據(jù)（可以是有監(jiān)督的數(shù)據(jù)或交互式的環(huán)境），以及可用于訓(xùn)練的計算量。算法創(chuàng)新和數(shù)據(jù)很難追蹤，但計算量是可量化的，這為衡量人工智能的進展速度提供了機會。當(dāng)然，大規(guī)模計算的使用有時候會暴露當(dāng)前算法的缺點。但至少在當(dāng)前的許多領(lǐng)域中，更多的計算似乎就可以預(yù)見更好的性能，并且計算力常常與算法的進步相輔相成。

對于“計算能力”，我們知道著名的“摩爾定律”（Moore's law）：集成電路上可容納的元器件的數(shù)目，約每隔 18-24 個月便會增加一倍，性能也將提升一倍。

今天，非盈利的AI研究機構(gòu)OpenAI發(fā)布了一份“AI與計算”的分析報告，報告顯示：

自2012年以來，在最大的AI訓(xùn)練運行中所使用的計算力呈指數(shù)增長，每3.5個月增長一倍（相比之下，摩爾定律的翻倍時間是18個月）。

自2012年以來，這個指標(biāo)已經(jīng)增長了30萬倍以上（如果增長一倍的時間需要18個月，僅能增長12倍）。

計算能力的提升一直是AI進步的一個關(guān)鍵要素，所以只要這種趨勢繼續(xù)下去，就值得我們?yōu)檫h(yuǎn)遠(yuǎn)超出當(dāng)今能力的AI系統(tǒng)的影響做好準(zhǔn)備。

AI計算的“摩爾定律”：3.43個月增長一倍

對于這個分析，我們認(rèn)為相關(guān)的數(shù)字不是單個GPU的速度，也不是最大的數(shù)據(jù)中心的容量，而是用于訓(xùn)練單個模型的計算量——這是與最好的模型有多么強大最為相關(guān)的數(shù)字。

由于并行性（硬件和算法）限制了模型的大小和它能得到有效訓(xùn)練的程度，每個模型的計算量與計算總量的差別很大。當(dāng)然，少量的計算下仍取得了許多重要的突破，但這個分析僅涵蓋計算能力。

Log Scale

上面的圖表顯示了用來訓(xùn)練一些著名模型并得到較好結(jié)果的計算總量，單位是petaflop/s-days，使用了大量時間計算，并提供了足夠的信息來估計所使用的計算。1 petaflop/s-days（pfs-day）是指一天執(zhí)行每秒10的15次方次神經(jīng)網(wǎng)絡(luò)操作，或總計10的20次方次操作。這個compute-time的單位是為了方便，類似于能量量度單位千瓦·時（kW-hr）。

我們沒有測量硬件的峰值理論FLOPS，而是嘗試估計執(zhí)行的實際操作的數(shù)量。我們將加法和乘法作為單獨的操作，將任何相加或相乘計算為一個操作，而不考慮數(shù)值的精度（因此“FLOP”不太適當(dāng)），并且我們忽略了集成模型。在本文附錄中提供了該圖表的示例計算。

Linear Scale

結(jié)果顯示，最優(yōu)擬合線的翻倍時間（doubling time）是3.43個月。

這一趨勢每年以10倍的速度增長。部分原因是由于定制硬件，允許在一定的價格下（GPU和TPU）每秒執(zhí)行更多的操作。但更主要的因素是研究人員不斷地尋找新的方法來并行地使用更多的芯片，并愿意支付更大的成本。

4個時代

從上面的圖表，我們可以大致劃分為4個時代：

2012年之前：為機器學(xué)習(xí)使用GPU并不常見，因此圖表中的任何結(jié)果都很難實現(xiàn)。

2012年至2014年：在多個GPU上訓(xùn)練的架構(gòu)并不常見，因此大多數(shù)結(jié)果使用1-8個GPU，性能是1-2 TFLOPS，總計為0.001-0.1 pfs-days。

2014年至2016年：大規(guī)模使用10-100個GPU，性能為5-10 TFLOPS，結(jié)果為0.1-10 pfs-days。數(shù)據(jù)并行性的收益遞減意味著更大規(guī)模的訓(xùn)練運行的價值是有限。

2016年到2017年：允許更大的算法并行性的方法，例如大的batch size、架構(gòu)搜索和專家迭代（expert iteration），以及TPU等專用硬件，更快的互連等，大大增加了這些限制，至少對某些應(yīng)用程序來說是如此。

AlphaGoZero / AlphaZero是大規(guī)模算法并行性最顯著的一個示例，但現(xiàn)在其他許多這樣大規(guī)模的應(yīng)用程序在算法上已經(jīng)是可行的，并且可能已經(jīng)在生產(chǎn)環(huán)境中應(yīng)用。

這種趨勢將持續(xù)下去，我們必須走在它前面

我們有很多理由認(rèn)為圖表里顯示的趨勢可以繼續(xù)下去。許多硬件初創(chuàng)公司都在開發(fā)AI專用的芯片，有些公司宣稱他們在未來1-2年內(nèi)將能夠大幅提高FLOPS / Watt（這與經(jīng)濟成本緊密相關(guān)）。通過簡單地重新配置硬件以降低經(jīng)濟成本，也可以完成相同數(shù)量的操作。在并行性方面，以上描述的許多最近的算法創(chuàng)新原則上都可以結(jié)合在一起——例如，架構(gòu)搜索算法和大規(guī)模并行的SGD。

另一方面，成本最終將限制這個趨勢的平行度，物理學(xué)也將限制芯片的效率。我們認(rèn)為，目前最大規(guī)模的訓(xùn)練運行采用的硬件成本僅為數(shù)百萬美元（盡管攤銷成本要低得多）。但目前大多數(shù)神經(jīng)網(wǎng)絡(luò)計算仍然用于推理（部署），而不是訓(xùn)練，這意味著公司可以重新調(diào)整用途或購買更多的芯片進行訓(xùn)練。因此，如果存在足夠的經(jīng)濟刺激，我們可以看到更多的大規(guī)模并行訓(xùn)練，從而使這一趨勢持續(xù)數(shù)年。全世界的硬件總預(yù)算每年達(dá)1萬億美元，因此絕對的限制依然很遠(yuǎn)。總的來說，考慮到上述數(shù)據(jù)、計算指數(shù)趨勢的先例、機器學(xué)習(xí)特定硬件的研究以及經(jīng)濟激勵，我們相信這種趨勢將持續(xù)下去。

對于這種趨勢將持續(xù)多久，以及持續(xù)下去會發(fā)生什么，用過去的趨勢來預(yù)測是不足夠的。但是，即使計算能力迅速增長的潛力處于合理范圍，也意味著今天就開始解決AI的安全問題和惡意使用問題是至關(guān)重要的。遠(yuǎn)見對于負(fù)責(zé)任的政策制定和負(fù)責(zé)任的技術(shù)發(fā)展都至關(guān)重要，我們必須走在這些趨勢前面，而不是對趨勢反應(yīng)遲鈍。

方法和最新結(jié)果

兩種方法用于生成這些數(shù)據(jù)點。當(dāng)我們有足夠的信息時，我們直接在每個訓(xùn)練樣例中描述的架構(gòu)中計算FLOP的數(shù)量（相加和相乘），并乘以訓(xùn)練期間的前向和后向通道總數(shù)。當(dāng)我們沒有足夠的信息來直接計算FLOP時，我們查看了GPU的訓(xùn)練時間和使用的GPU總數(shù)，并假設(shè)了使用效率（通常為0.33）。對于大多數(shù)論文，我們能夠使用第一種方法，但對于少數(shù)論文，我們依賴第二種方法，并且為了進行一致性檢測，我們盡可能計算這兩個指標(biāo)作為。在大多數(shù)情況下，我們也向作者證實了這一點。計算并不是精確的，但我們的目標(biāo)是在2-3倍的范圍內(nèi)做到正確。我們在下面提供一些示例計算。

案例1：計數(shù)模型中的操作

當(dāng)作者給出正向傳遞使用的操作數(shù)時，這種方法特別容易使用，就像在Resnet論文中（特別是Resnet-151模型）一樣：

這些操作也可以在一些深度學(xué)習(xí)框架中以編程方式計算已知的模型體系結(jié)構(gòu)，或者我們可以簡單地手動計算操作。如果一篇論文提供了足夠的信息來進行計算，它將會非常準(zhǔn)確，但在某些情況下，論文不包含所有必要的信息，作者也無法公開它。

方法2的示例：GPU時間

如果我們不能直接計算，我們可以看看有多少GPU經(jīng)過多長時間的訓(xùn)練，并且在GPU利用率上使用合理的猜測來嘗試估計執(zhí)行的操作次數(shù)。我們強調(diào)，這里我們不計算峰值理論FLOPS，但是使用理論FLOPS的假定分?jǐn)?shù)來嘗試猜測實際FLOPS。根據(jù)我們自己的經(jīng)驗，我們通常假設(shè)GPU的利用率為33％，CPU的利用率為17％，除非我們有更具體的信息（例如我們有和作者進行交流或在OpenAI上完成這些工作）。

舉個例子，在AlexNet的論文中提到“在兩個GTX 580 3 GB的GPU上，訓(xùn)練我們的網(wǎng)絡(luò)需要5到6天的時間”。在我們的假設(shè)下，這意味著總計算：

這種方法近似度更高，可以很容易地減少2倍或以上，我們的目標(biāo)僅僅是估計數(shù)量級。在實踐中，當(dāng)這兩種方法都可用時，它們通常會很好地排列（對于AlexNet來說，我們也可以直接計算操作，在GPU時間方法上，計算結(jié)果分別是 0.0054 pfs-days和0.0058 pfs-days。

使用適量計算的最新結(jié)果

大規(guī)模計算當(dāng)然不是產(chǎn)生重要結(jié)果的要求。最近許多值得注意的結(jié)果僅使用適量的計算。以下是使用適度計算的結(jié)果的一些例子，它提供了足夠的信息來估計它們的計算。我們沒有使用多種方法來估計這些模型的計算結(jié)果，對于上限，我們對任何缺失的信息進行了保守估計，因此它們具有更大的整體不確定性。這些估計對我們的定量分析并不是十分重要，但我們?nèi)匀徽J(rèn)為它們很有趣，值得分享：

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

摩爾定律

摩爾定律

+關(guān)注

關(guān)注
4

文章
636

瀏覽量
79196
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4768

瀏覽量
129261
AI

AI

+關(guān)注

關(guān)注
87

文章
31493

瀏覽量
270049

原文標(biāo)題：【AI計算的新摩爾定律】3.5個月翻一倍，6年增長30萬倍

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

OpenAI 深夜拋出王炸 “ChatGPT- 4o”， “她” 來了

當(dāng)?shù)貢r間5月13日OpenAI推出ChatGPT-4o，代表了人工智能向前邁出的一大步。在GPT-4turbo的強大基礎(chǔ)上，這種迭代擁有顯著的改進。在發(fā)布會的演示中，

發(fā)表于 05-27 15:43

AI人工智能：54份行業(yè)重磅報告匯總（附下載）

：AI+：2016人工智能影響力微報告 發(fā)布機構(gòu)：阿里研究院時間：2017.1報告16：IAIS2016人工智能趨勢與應(yīng)用—李成華

發(fā)表于 11-21 09:56

數(shù)據(jù)報告顯示，用戶認(rèn)為智能音箱比預(yù)期的有用的多

　　近日全球著名的信息技術(shù)、通信行業(yè)和消費科技市場研究機構(gòu)Strategy Analytics發(fā)布了一份關(guān)于智能音箱的研究報告，在這份名

發(fā)表于 10-02 09:23

寫一份良好的Bug報告

沒錯，任何軟件都存在bug，哪怕是我們自己也存在缺陷，因為程序員也是普通人，人是會犯錯誤的。當(dāng)有人在使用軟件時遇到bug，你需要使用郵件形成一份缺陷bug，發(fā)送給開發(fā)人員。開發(fā)者可以依據(jù)該報告定位問題，復(fù)現(xiàn)問題，修復(fù)問題。

發(fā)表于 07-17 08:17

EdgeBoard FZ5 邊緣AI計算盒及計算卡

作為人工智能項目落地的硬件平臺，也可以將EdgeBoard計算卡嵌入終端設(shè)備，使設(shè)備具備AI推理能力。繼7月份發(fā)布第

發(fā)表于 08-31 14:12

美國發(fā)布35頁科技趨勢報告！精選資料分享

未來30年，這20項技術(shù)將顛覆人類生活>>>>美國公布了一份長達(dá)35頁的《新興科技趨勢報告》。該報告是在美國過去五年內(nèi)由***機構(gòu)、咨詢機構(gòu)

發(fā)表于 07-12 07:38

清華出品：最易懂的AI芯片報告！人才技術(shù)趨勢都在這里精選資料分享

，數(shù)據(jù)量呈現(xiàn)爆炸性增長態(tài)勢，而傳統(tǒng)的計算架構(gòu)又無法支撐深度學(xué)習(xí)的大規(guī)模并行計算需求，于是研究界對 AI 芯片進行了新一輪的技術(shù)研發(fā)與應(yīng)用

發(fā)表于 07-23 09:19

蘋果發(fā)布首份人工智能報告

蘋果本月初曾表示，將發(fā)布自己的人工智能研究報告。不到一個月的時間，蘋果就兌現(xiàn)了承諾。近日，蘋果發(fā)布了

發(fā)表于 12-27 10:21 ?536次閱讀

2018中國AI計算力報告發(fā)布

今天上午，浪潮公司聯(lián)合IDC在2018中國人工智能計算大會上發(fā)布了《2018中國AI計算力發(fā)展報告

發(fā)表于 09-15 08:37 ?4289次閱讀

AI指數(shù)報告看幾大國AI領(lǐng)域的研究進展和趨勢大比拼

斯坦福大學(xué)的第二份年度AI指數(shù)報告匯總分析了人工智能領(lǐng)域的研究進展和趨勢的數(shù)據(jù)和論文

發(fā)表于 03-01 16:21 ?692次閱讀

AI表現(xiàn)搶眼但依舊是一次性使用的工具

近日，斯坦福聯(lián)合MIT、哈佛、OpenAI等院校和機構(gòu)發(fā)布了一份長達(dá)291頁的“2019年度AI指數(shù)報告

發(fā)表于 12-19 15:06 ?619次閱讀

《企業(yè)人工智能（AI）市場報告》是一份全面的研究文檔

該報告將根據(jù)與COVID-19大流行有關(guān)的最新經(jīng)濟情況和市場規(guī)模進行更新。該報告涵蓋了后COVID方案中的增長前景以及當(dāng)前和未來的銷售估計。該報告還涵蓋了由大流行引起的不斷變化的市場

發(fā)表于 09-16 14:52 ?1485次閱讀

Omdia發(fā)布最新報告，已確定未來邊緣AI增長的五大關(guān)鍵領(lǐng)域

領(lǐng)先分析機構(gòu)Omdia今天發(fā)布了最新報告，確定了邊緣AI增長

發(fā)表于 10-15 11:47 ?1935次閱讀

歐盟發(fā)布了關(guān)于人工智能技術(shù)倫理問題的報告

歐盟基本權(quán)利機構(gòu)（FRA）發(fā)布了一份關(guān)于人工智能的報告，深入探討了必須考慮的技術(shù)倫理問題。

發(fā)表于 12-15 14:01 ?1777次閱讀

一份難得的MOS管封裝分析報告（含主流廠商封裝）資料下載

電子發(fā)燒友網(wǎng)為你提供一份難得的MOS管封裝分析報告（含主流廠商封裝）資料下載的電子資料下載，更有其他相關(guān)的電路圖、源代碼、課件教程、中文資料、英文資料、參考設(shè)計、用戶指南、解決方案等資料，希望可以幫助到廣大的電子工程師們。

發(fā)表于 04-18 08:51 ?31次下載

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

OpenAI發(fā)布了一份關(guān)于AI計算能力增長趨勢的分析報告

評論

OpenAI 深夜拋出王炸 “ChatGPT- 4o”， “她” 來了

AI人工智能：54份行業(yè)重磅報告匯總（附下載）

數(shù)據(jù)報告顯示，用戶認(rèn)為智能音箱比預(yù)期的有用的多

寫一份良好的Bug報告

EdgeBoard FZ5 邊緣AI計算盒及計算卡

美國發(fā)布35頁科技趨勢報告！精選資料分享

清華出品：最易懂的AI芯片報告！人才技術(shù)趨勢都在這里精選資料分享

蘋果發(fā)布首份人工智能報告

2018中國AI計算力報告發(fā)布

AI指數(shù)報告看幾大國AI領(lǐng)域的研究進展和趨勢大比拼

AI表現(xiàn)搶眼但依舊是一次性使用的工具

《企業(yè)人工智能（AI）市場報告》是一份全面的研究文檔

Omdia發(fā)布最新報告，已確定未來邊緣AI增長的五大關(guān)鍵領(lǐng)域

歐盟發(fā)布了關(guān)于人工智能技術(shù)倫理問題的報告

一份難得的MOS管封裝分析報告（含主流廠商封裝）資料下載