兽性总裁的爱奴,欢乐颂小说txt,遮天

這就是 GPT 的「抽象」，和人類的抽象不太一樣。

雖然 ChatGPT 似乎讓人類正在接近重新創造智慧，但迄今為止，我們從來就沒有完全理解智能是什么，不論自然的還是人工的。

認識智慧的原理顯然很有必要，如何理解大語言模型的智力？OpenAI 給出的解決方案是：問問 GPT-4 是怎么說的。

5 月 9 日，OpenAI 發布了最新研究，其使用 GPT-4 自動進行大語言模型中神經元行為的解釋，獲得了很多有趣的結果。

可解釋性研究的一種簡單方法是首先了解 AI 模型各個組件（神經元和注意力頭）在做什么。傳統的方法是需要人類手動檢查神經元，以確定它們代表數據的哪些特征。這個過程很難擴展，將它應用于具有數百或數千億個參數的神經網絡的成本過于高昂。

所以 OpenAI 提出了一種自動化方法 —— 使用 GPT-4 來生成神經元行為的自然語言解釋并對其進行評分，并將其應用于另一種語言模型中的神經元 —— 此處他們選擇了 GPT-2 為實驗樣本，并公開了這些 GPT-2 神經元解釋和分數的數據集。

論文地址：https://openaipublic.blob.core.windows.net/neuron-explainer/paper/index.html

GPT-2 神經元圖：https://openaipublic.blob.core.windows.net/neuron-explainer/neuron-viewer/index.html

代碼與數據集：https://github.com/openai/automated-interpretability

這項技術讓人們能夠利用 GPT-4 來定義和自動測量 AI 模型的可解釋性這個定量概念：它用來衡量語言模型使用自然語言壓縮和重建神經元激活的能力。由于定量的特性，我們現在可以衡量理解神經網絡計算目標的進展了。

OpenAI 表示，利用他們設立的基準，用 AI 解釋 AI 的分數能達到接近于人類的水平。

OpenAI 聯合創始人 Greg Brockman 也表示，我們邁出了使用 AI 進行自動化對齊研究的重要一步。

具體方法

使用 AI 解釋 AI 的方法包括在每個神經元上運行三個步驟：

步驟一：用 GPT-4 生成解釋

給定一個 GPT-2 神經元，通過向 GPT-4 展示相關文本序列和激活來生成對其行為的解釋。

模型生成的解釋：對電影、角色和娛樂的引用。

步驟二：使用 GPT-4 進行模擬

再次使用 GPT-4，模擬被解釋的神經元會做什么。

步驟三：對比

根據模擬激活與真實激活的匹配程度對解釋進行評分 —— 在這個例子上，GPT-4 的得分為 0.34。

主要發現

使用自己的評分方法，OpenAI 開始衡量他們的技術對網絡不同部分的效果，并嘗試針對目前解釋不清楚的部分改進技術。例如，他們的技術對較大的模型效果不佳，可能是因為后面的層更難解釋。

OpenAI 表示，雖然他們的絕大多數解釋得分不高，但他們相信自己現在可以使用 ML 技術來進一步提高他們產生解釋的能力。例如，他們發現以下方式有助于提高分數：

迭代解釋。他們可以通過讓 GPT-4 想出可能的反例，然后根據其激活情況修改解釋來提高分數。

使用更大的模型來進行解釋。隨著解釋模型（explainer model）能力的提升，平均得分也會上升。然而，即使是 GPT-4 給出的解釋也比人類差，這表明還有改進的余地。

改變被解釋模型（explained model）的架構。用不同的激活函數訓練模型提高了解釋分數。

OpenAI 表示，他們正在將 GPT-4 編寫的對 GPT-2 中的所有 307,200 個神經元的解釋的數據集和可視化工具開源。同時，他們還提供了使用 OpenAI API 上公開可用的模型進行解釋和評分的代碼。他們希望研究界能夠開發出新的技術來生成更高分的解釋，同時開發出更好的工具來通過解釋探索 GPT-2。

他們發現，有超過 1000 個神經元的解釋得分至少為 0.8 分，這意味著根據 GPT-4，它們占據了神經元的大部分頂級激活行為。這些得到很好解釋的神經元中的大多數都不是很有趣。然而，他們也發現了許多有趣但 GPT-4 并不理解的神經元。OpenAI 希望隨著解釋的改進，他們可能會迅速發現對模型計算的有趣的定性理解。

以下是一些不同層神經元被激活的例子，更高的層更抽象：

看起來，GPT 理解的概念和人類不太一樣？

OpenAI 未來工作

目前，該方法還存在一些局限性，OpenAI 希望在未來的工作中可以解決這些問題：

該方法專注于簡短的自然語言解釋，但神經元可能具有非常復雜的行為，因而用簡潔地語言無法描述；

OpenAI 希望最終自動找到并解釋整個神經回路實現復雜的行為，神經元和注意力頭一起工作。目前的方法只是將神經元的行為解釋為原始文本輸入的函數，而沒有說明其下游影響。例如，一個在周期（period）上激活的神經元可以指示下一個單詞應該以大寫字母開頭，或者增加句子計數器；

OpenAI 解釋了神經元的這種行為，卻沒有試圖解釋產生這種行為的機制。這意味著即使是得高分的解釋在非分布（out-of-distribution）文本上也可能表現很差，因為它們只是描述了一種相關性；

整個過程算力消耗極大。

最終，OpenAI 希望使用模型來形成、測試和迭代完全一般的假設，就像可解釋性研究人員所做的那樣。此外，OpenAI 還希望將其最大的模型解釋為一種在部署前后檢測對齊和安全問題的方法。然而，在這之前，還有很長的路要走。

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經元

神經元

+關注

關注
1

文章
363

瀏覽量
18452
語言模型

語言模型

+關注

關注
0

文章
524

瀏覽量
10277
GPT

GPT

+關注

關注
0

文章
354

瀏覽量
15379
OpenAI

OpenAI

+關注

關注
9

文章
1089

瀏覽量
6516

原文標題：OpenAI用GPT-4解釋了GPT-2三十萬個神經元：智慧原來是這個樣子

文章出處：【微信號：tyutcsplab，微信公眾號：智能感知與物聯網技術研究所】歡迎添加關注！文章轉載請注明出處。

OpenAI宣布，發布了7.74億參數GPT-2語言模型

就在本周，OpenAI宣布，發布了7.74億參數GPT-2語言模型，15.58億的完整模型也有望于幾個月內發布，并將GPT-2這6個月的進展

發表于 09-01 09:10 ?3005次閱讀

GPT-4發布！多領域超越“人類水平”，專家：國內落后2-3年

電子發燒友網報道（文/吳子鵬）北京時間3月15日凌晨，人工智能研究公司OpenAI正式發布了其下一代大型語言模型GPT-4。目前，ChatGPT的Plus訂閱用戶已經可以使用GPT-4

發表于 03-16 01:58 ?4706次閱讀

<b class='flag-5'>GPT-4</b>發布！多領域超越“人類水平”，專家：國內落后<b class='flag-5'>2</b>-3年

ChatGPT升級　OpenAI史上最強大模型GPT-4發布

ChatGPT升級史上最強大模型GPT-4發布 OpenAI正式推出了ChatGPT升級版本，號稱史上最強大模型GPT-4發布。OpenAI期待G

發表于 03-15 18:15 ?2825次閱讀

GPT-4是這樣搞電機的

GPT-4寫電機基礎程序沒問題

發表于 04-17 09:41 ?1020次閱讀

GPT-4處于一個什么樣的編碼地位

發布的 GPT-4 Developer Livestream（https://www.youtube.com/watch?v=outcGtbnMuQ）視頻中，我們親眼見證了 OpenAI CTO

發表于 06-16 10:42 ?787次閱讀

人工通用智能的火花：GPT-4的早期實驗

]，是使用前所未有的計算和數據規模訓練出來的。在本文中，我們報告了我們對GPT-4早期版本的調查，當時它還在OpenAI 的積極開發中。我們認為，（這個早期版本的）GPT-4是新一批

發表于 06-20 15:49 ?1次下載

OpenAI宣布GPT-4 API全面開放使用！

OpenAI 在博客文章中寫道：“自 3 月份以來，數百萬開發者請求訪問 GPT-4 API，并且利用 GPT-4 的創新產品范圍每天都在增長。” “我們設想基于對話的模型未來可以支持任何用例。”

發表于 07-12 14:55 ?1263次閱讀

GPT-3.5 vs GPT-4：ChatGPT Plus 值得訂閱費嗎國內怎么付費？

每月20美元）更智能、更準確。 OpenAI將GPT-4描述為“比其前身GPT-3.5先進10倍”。自從OpenAI的大語言模型(LLM)GPT-

發表于 08-02 12:09 ?4272次閱讀

GPT-4沒有推理能力嗎？

今年三月，OpenAI 重磅發布了 GPT-4 大模型，帶來了比 ChatGPT 背后 GPT-3.5 更強的推理、計算、邏輯能力，也引發了全民使用的熱潮。在各行各領域研究人員、開發者

發表于 08-11 14:20 ?897次閱讀

OpenAI最新大模型曝光！劍指多模態，GPT-4之后最大升級！

目前為止，OpenAI還沒有對爆料中的傳聞做出回應，但此前發布過多模態模型測試。CEO奧特曼在回應有關GPT-5的傳聞時，也暗示過GPT-4“正在增強”。

發表于 09-20 17:34 ?1229次閱讀

ChatGPT重磅更新　OpenAI發布GPT-4 Turbo模型價格大降2/3

構建各種各樣的用例；有超過92%的財富世界500強企業以我們的產品為基礎；GPT的周活躍用戶達到大約1億。” OpenAI的重點來了： OpenAI發布

發表于 11-07 18:20 ?2815次閱讀

OpenAI發布的GPT-4 Turbo版本ChatGPT plus有什么功能？

GPT-4的最新版本。OpenAI憑借承諾增強功能和成本效率的模型實現了巨大飛躍，為人工智能行業樹立了新標準。我們來看看OpenAI帶來了什么：文本和圖像理解

發表于 12-05 17:57 ?2510次閱讀

ChatGPT plus有什么功能？OpenAI 發布 GPT-4 Turbo 目前我們所知道的功能

OpenAI 發布 GPT-4 Turbo 目前我們所知道的功能分析解答在最近的OpenAI DevDay上，該組織發布了一項備受期待的公告：推出

發表于 12-13 09:19 ?1143次閱讀

OpenAI API Key獲取：開發人員申請GPT-4 API Key教程

? OpenAI的GPT-4模型因其卓越的自然語言理解和生成能力，成為了許多開發者的首選工具。獲取GPT-4 API Key并將其應用于項目，如開發一個ChatGPT聊天應用，不僅是實

發表于 06-24 17:40 ?2375次閱讀

OpenAI推出新模型CriticGPT，用GPT-4自我糾錯

基于GPT-4的模型——CriticGPT，這款模型專為捕獲ChatGPT代碼輸出中的錯誤而設計，其獨特的作用在于，讓人們能夠用GPT-4來查找GPT-4的錯誤。

發表于 06-29 09:55 ?549次閱讀