在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么要做AI研究器

深度學習自然語言處理 ? 來源:李rumor ? 2023-08-23 15:56 ? 次閱讀

對于怎么實現AGI這個玄學的目標,感覺大家都是差不多的狀態:咱也不知道怎么做,但就是覺得現在的LLM技術還遠遠不夠。

所以之前看到OpenAI說要用模型去做對齊研究[1],以及最近發話要4年內做出SuperAlignment[2]時,我都是一臉問號,覺得沒什么新東西,get不到他們的思路。

為什么要做AI研究器

直到最近斷斷續續刷了兩遍Jan Leike的訪談,我突然有種悟了的感覺,原來核心思想就這么簡單。而且回過頭看,OpenAI近幾年其實就是在遵循這個思想,卻做出了看似「暴力」的一個個突破。

OpenAI所選擇的路徑就是:「Turn compute into alignment」,通過計算的量變產生智能的質變。計算需要數據、算力、模型框架的共同作用,拆解成具體的步驟,則是自動化->規模化->迭代。

以前我們總以「范式」這個詞來劃分NLP的發展,比如監督學習->預訓練+精調->預訓練+RLHF。其實這些范式只是增加有效計算量的方法:

自動化:有監督 -> 自監督,擺脫人的依賴,更高效地獲取監督信號

規模化:在更多的數據、更大的模型上進行更多的計算

迭代:不斷基于新的case迭代模型,形成數據飛輪

自動化和規模化所帶來的質變不用多說,GPT系列足以證明。但最后一步的「迭代」卻經常被忽視,而這可能是通向Superalignment重要的一步,Alpha GO就是最好的栗子。它從最開始模仿人類棋手落子,到具備基本能力后不斷自我博弈,最終超越人類棋手。

那么問題來了:目前我們所做的「迭代」,不管是RLHF還是純SFT,仍舊需要人工提供監督信號,無法做到自動化和規模化,迭代速度就會很慢。同時人類也無法監督超越自身水平的任務,不可能訓出超智能的模型。這就是為什么OpenAI從22年就開始說,要用AI來輔助人類進行評估[3]。

繼續思考,如果有個模型可以給出等同人類水平的監督信號,我們除了評估還可以用它干什么?當然是順著量變產生質變的思想,讓它自動化、規模化地幫忙迭代出AGI呀!

自動化:讓AI研究器自動規劃實驗、提供監督信號訓練模型

規模化:把上述自動流程擴展

迭代:AI研究器本身也是一個模型,讓它們雞生蛋蛋生雞,不斷互相訓練

想到這里,OpenAI為什么要構建「a roughly human-level automated alignment researcher」的思路就水到渠成了。不知道Jan Leike大佬的思考邏輯是怎樣的,反正我自己這么捋下來還挺順,歡迎討論。

如何做AI研究器

找到「AI研究器」這個啟動點之后,接下來就是怎么實現的問題了。相比于如何訓練出這個模型,Jan大佬把主要的中心都放在了如何構建自動化、全面化的評估上,其實跟上面的道理一樣,好的評估可以提供監督反饋,從而指導模型的迭代方向。

首先,需要能驗證模型可以達到人類水平。其實要真正評估出這個還是很難的,就像現在業內這么多模型,沒人能給出一個真的排行榜一樣。而且最好是自動化的,避免人來提供ground truth,才能進行更全面的評估。這里大佬提供了一個discriminator-critique gap的測量方法,比如我們做了一個編程模型,想利用ChatGPT自動評估他的效果,最簡單的做法是直接命令ChatGPT判斷某道編程題做的對不對。那問題就來了,我們怎么確定ChatGPT評估結果是否置信?都人工看一遍太浪費時間了。自動化的做法是直接基于ChatGPT訓練一個判斷變成結果是否正確的判別模型,然后我們專門用一些有label的難樣本,去看判別模型的準確率和ChatGPT的準確率,如果差的不多,就說明不用訓練也可以用它直接評估編程結果的好壞。

其次,自動化地進行魯棒性檢測、可解釋性分析。為啥非要做可解釋性呢?

可以為我們指出解決問題的途徑

現有很多研究是在做知識和神經元的關聯性,大佬認為更有意義的是自動化、規模化地去做,從而探究更高維度(模型整體)的可解釋性

最后,故意訓練不對齊的模型進行對抗測試,驗證評估方法的有效性。從而避免出現假對齊的情況。最極端的就是真訓出了一個超級智能,他可能會想辦法備份自己的權重,逃脫人類控制,需要專門通過其他代理任務(比如讓模型去hack某臺機器)看一下這個程度有多難,評估系統能否檢測出來。

投入成本的考量

OpenAI未來4年內將會在Superalignment上組建30-100人規模的團隊,投入20%的算力。其實20%個人感覺主要是先表個決心,這個數量Jan大佬說已經是對齊方向上最大的單筆投入了,做得好以后還會再加。

倒是4年這個規劃,說近不近說遠不遠,還關乎于其他從業者要經歷多久的紅利衰退期(狗頭),Jan給出了如下規劃:

2年內搞清楚用什么技術實現AI對齊研究器,把問題拆的足夠細,剩下就是工程問題了

3年內實現AI對齊研究器

剩下一年探索超級對齊

這么一看時間還是挺緊的,后面兩個計劃略顯樂觀,Jan給出的信心是85%,而且表示有很多實驗已經在實驗中了(至少從22年8月那個博文發出前就開始研究了)。他的信心主要來自于5方面:

語言模型的成功:LLM可以理解自然語言,讓我們可以向模型表達我們希望他們怎么做,操控起來更加容易

RLHF的效果超出預期:只用了很少的計算,甚至還沒嘗試收集數據,就可以在小模型上得到比大模型更好的效果

在評估度量方面已經取得了很多進展,可以提供改進的方向

評估比生成更簡單:如果人類只做評估,而不做生成,那么開發速度就會加快,還是自動化監督信號的思想

對語言模型的信念:語言模型很適合做超級對齊,任何任務都可以表述為文本的輸入輸出,不管是做實驗和理解結果都可以做

目前的技術還有用嗎

對于預訓練,Jan Leike認為預測下一個token這種方式并不一個長期目標,可能需要更好的任務。個人認為互聯網上視頻、圖像、文字數據遲早會被消耗殆盡,所以目前的預訓練主要是提供一個較好的基模型,后續高質量的監督信號應該會來源于模型本身,就像前文一直說的「自動化」。但這樣是否還能稱作「預訓練」就不一定了。

對于RLHF,Jan Leike也持懷疑態度,因為目前的監督信號來源于人工評判,但人工并不擅長區分看起來都很好的答案,各種論文顯示人類之間的一致率有70%就不錯了,這個監督信號本身自己都不一定對的齊。同時,需要人工就導致無法規模化擴展,也不符合我們增加計算量的需求。

目前預訓練+RLHF的范式大概率也只是AI發展中的一個版本,按照OpenAI的AI研究器思路,后續模型訓練的系統復雜度可能會提升很多,估計會有N多個擅長不同任務的AI研究器來訓一個模型,人工只需要提供少量監督信號,告訴系統要做什么,就可以讓他們自動運轉,訓完了自動同步權重,不斷升級。

總結

整個Jan Leike的采訪看下來,真的收獲頗豐,不知道有沒有清晰地表達出來,其實就是:

計算是核心,計算的量變產生智能的質變

加速有效計算量的方法是:自動化->規模化->迭代

就像人類百萬年來,從石器時代進化到現在的信息時代,科技的進步不是一蹴而就,而是螺旋上升,由幾代人的智慧凝結而成。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31077

    瀏覽量

    269411
  • 模型
    +關注

    關注

    1

    文章

    3259

    瀏覽量

    48907
  • nlp
    nlp
    +關注

    關注

    1

    文章

    489

    瀏覽量

    22052
  • OpenAI
    +關注

    關注

    9

    文章

    1100

    瀏覽量

    6572

原文標題:總結

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    當我們談AI時 我們要做什么?

    這樣高度重合,在過去的幾年里,AI技術的創新速度驚人,小規模的企業也以前所未有的速度成長。 有研究機構斷言,定制AI芯片、IoT與AI在邊緣計算的融合、神經網絡的互操作性、自動化機器學
    發表于 01-15 15:03 ?2217次閱讀

    AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

    人工智能在科學研究中的核心技術,包括機器學習、深度學習、神經網絡等。這些技術構成了AI for Science的基石,使得AI能夠處理和分析復雜的數據集,從而發現隱藏在數據中的模式和規律。 2. 高性能
    發表于 10-14 09:16

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    人們對AI for Science的關注推向了高潮。 2. 跨學科融合與科學研究新范式 AI與生命科學的結合,不僅推動了生命科學本身的進步,還促進了多個學科之間的交叉融合。這種跨學科的合作模式,打破
    發表于 10-14 09:21

    基于CPLD的SPI控制研究與實現

    要做基于CPLD的SPI控制研究與實現,有沒有會的人,求教,有什么資料推薦點也行
    發表于 04-27 14:37

    要做一套水質監測系統,想請問一下各位大神有研究得能提供一下方案不

    現在想要做一套水質監測系統,系統的實現,關于傳感的選型,想要請教一下各位大神,請大家有研究的分享一下,謝謝
    發表于 04-08 17:03

    AI大學·未來課棧@成都棧」報名開啟,AI 帶你大開眼界!

    ` 本帖最后由 訊飛開放平臺 于 2018-6-9 10:21 編輯 2018年「AI大學·未來課棧@成都棧」將于6月14日在成都拉開序幕。這一次我們攜手中科院上海微系統研究員張曉林、云孚
    發表于 06-09 10:16

    AI研究所:指甲上有問題,去醫院該掛什么科?

    科學研究,智能算法能挖掘變量相關性,激發論文思路,同時提供針對臨床科研的專業統計分析支持。3 診后可以讓AI在檢查和就診后,評估愈后狀況,甚至給出建議。同時這些數據也可以更好的用于科研,給醫生提供這樣的科研
    發表于 08-07 09:17

    【免費直播】讓AI芯片擁有最強大腦—AI芯片的操作系統設計介紹.

    、深度學習推斷處理(DPU)運行時設計介紹3、如何加速優化,提高系統并行執行效率1、AI芯片中的操作系統管理原則2、操作系統運行時設計準則3、多核多線程加速計算效率方法主講老師:陳小柏,男,中山大學
    發表于 11-07 14:18

    【HarmonyOS HiSpark AI Camera】基于HiSpark AI Camera HarmonyOS 智能巡檢機器人開發

    Camera HarmonyOS 鴻蒙OS開發板首先介紹一下,我叫abner,本科湖北工業大學,碩士在合肥工業大學,參與導師國家級重大科研項目。現在供職于上海**智能科技有限公司,現在項目主要做AI賦能toB
    發表于 11-18 18:15

    MCU也需要AI

    人工智能(AI)是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。人工智能
    發表于 11-03 09:17

    AI是什么呢?AI應用又會給人們帶來哪些改變

    Intelligence的縮寫,即人工智能。它是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。AI研究工作已取得驚人進展,經過學習后,機器在操作某些環節時比人類更快、更精
    發表于 12-20 06:42

    Ai 部署的臨界考慮電子指南

    雖然GPU解決方案對訓練,AI部署需要更多。 預計到2020年代中期,人工智能行業將增長到200億美元,其中大部分增長是人工智能推理。英特爾Xeon可擴展處理約占運行AI推理的處理
    發表于 08-04 07:25

    依圖率先入局,AI算法獨角獸為什么要做芯片?

    依圖率先入局,AI算法獨角獸為什么要做芯片視覺四小龍之一的依圖科技推出云端視覺推理AI芯片“求索”,以及基于該芯片構建的服務產品和行業解決方案。依圖成立于2012年,已經完成6輪融資
    發表于 07-02 17:14 ?896次閱讀

    AI ready是什么?文明的發展需要做好準備

    接入”那么簡單,還需要做好“AI ready”。 AI ready及其重要性 AI ready這個概念最早是由飛書提出的,在去年11月末的飛書7發布會上,飛書CEO謝欣提到:“在
    的頭像 發表于 01-17 10:19 ?611次閱讀
    <b class='flag-5'>AI</b> ready是什么?文明的發展需<b class='flag-5'>要做</b>好準備

    世界榮耀,做AI時代的海

    齊聚全球5大AI巨頭,榮耀要做AI時代的海
    的頭像 發表于 02-28 18:23 ?1166次閱讀
    世界榮耀,做<b class='flag-5'>AI</b>時代的海
    主站蜘蛛池模板: 天天插插| 国产hs免费高清在线观看| 小优视频在线| 午夜精品在线观看| 天天艹天天操| 国产精品久久久久久福利| 欧美性精品| 欧美日本一道免费一区三区| 国产亚洲一区二区三区在线| 亚洲综合啪啪| 三级理论在线观看| 久久这里只有精品免费视频| 国产日韩三级| 午夜福利毛片| 国产黄色片一级| 8888奇米四色在线| 伊人久久狼人| 青娱乐久草| 成人永久免费视频| 台湾一级毛片永久免费| jlzzjlzzjlzz日本亚洲| 亚色网站| 深夜释放自己vlog糖心旧版本| 欧美透逼视频| 成人免费淫片95视频观看网站| 天堂在线最新资源| 欧美一区色| 亚洲色图吧| 模特精品视频一区| sihu免费观看在线高清| 女女同免费播放毛片| 开心激情五月婷婷| 亚洲综合亚洲综合网成人| 女人爽到喷水的视频大全在线观看| 丁香婷五月| 国产精选经典三级小泽玛利亚| 美女被强插| 欧美三级视频在线| 香蕉视频在线观看国产| 天天操91| 天堂中文资源网|