在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ChatGPT的潛力和局限

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-06-13 17:23 ? 次閱讀

今天為大家分享一篇研究,當ChatGPT穿越到口袋妖怪世界,是否會理解并應用這個虛構世界的知識呢?

熟悉口袋妖怪的朋友們一定知道,這些可愛的生物們有著各種不同的屬性、類別和技能。它們生活的世界也是一個完整的環境:你可以收集口袋妖怪、培養它們的實力,然后讓它們在戰斗中一展身手。每一個系統都有詳細的、明確的規定。

而現在,我們把這個酷炫的口袋妖怪世界作為評估ChatGPT知識和推理能力的環境!我們可以檢查ChatGPT對口袋妖怪世界的了解程度,并向它輸入新的知識,讓它在妖怪們的戰斗中進行推理,預測戰斗結果。

通過在口袋妖怪世界的實驗,我們能更好地評估ChatGPT的潛力和局限,看看它是否能夠學習新知識,基于特定情境的特征組合進行推理,從而做出更準確的判斷。

為了評估ChatGPT,作者引入了一個分階段的對話框架(如下圖),包括三個明確定義的階段:

72ce0a1e-0605-11ee-962d-dac502259ad0.png

階段1:Audit knowledge

首先,ChatGPT具有口袋妖怪世界的背景知識嗎?

作者通過詢問一般性問題,如有關口袋妖怪類型和物種的描述,來審核ChatGPT對口袋妖怪世界的先驗知識。這些檢索到的知識被存儲在local memory中,作為對話的上下文,以便在接下來的步驟中構建合理的場景。同時,這些知識還可以提高后續模型的回應準確性,減少虛構情況的發生。

在階段一,作者從一些初步的一般性問題開始。這個階段對于隨后創建有效的溝通至關重要。我們區分global memory和local memory。前者是在訓練期間獲得的,包括ChatGPT的先驗知識。local memory僅限于我們之前的相互作用,并作為后驗相互作用的參考點。ChatGPT對口袋妖怪類型等問題上有很強的抵抗能力。但在Q1.4中的對抗提問中失敗了。

下面是一個例子:注意ChatGPT的答案用顏色標記,如果提供準確的知識,則用綠色,如果提供虛假陳述(幻覺),則用紅色,如果陳述模糊或不相關,則用黃色

7303c17c-0605-11ee-962d-dac502259ad0.png

階段2:Use of knowledge in context

作者呈現了特定的戰斗場景,其中口袋妖怪們的類型、等級、招式和狀態相互作用并導致特定的結果。ChatGPT將用于預測戰斗的結果,并逐步解釋其推理過程。這個階段將評估模型是否能夠基于特定情境(上下文)組合特征(組合性),從而確定戰斗結果。

在階段二,作者呈現了口袋妖怪的簡單戰斗場景,并逐漸增加復雜性(不同級別、天氣和狀態條件),并要求ChatGPT預測戰斗的結果并解釋其推理。這一階段將幫助我們理解模型是否可以基于決定其結果的特定場景(上下文)組合特征(組合性)。

結果發現,大多數回答都是準確的。ChatGPT了解口袋妖怪的類型、移動(攻擊)和等級如何影響戰斗匹配。ChatGPT能夠預測,也可以全面地解釋其推理。但是,不同類型的問題上,ChatGPT的準確性差異較大。

作者總共測試了24場戰斗:6場涉及不同類型(準確率為83.3%),6場涉及不同級別(100%),7場涉及4種天氣條件(85.7%),6場涉及4種狀態效果(100%)。

作者介紹了具有正式規格(名稱、外觀、類型、招式)的新妖怪。然后,要求ChatGPT驗證對這些新概念的掌握,并將其與其先前知識進行比較。注意,ChatGPT將新引入的知識存儲在local memory中,但它將無法長時間引用它。

下面是一個測試例子:注意ChatGPT的答案用顏色標記,如果提供準確的知識,則用綠色,如果提供虛假陳述(幻覺),則用紅色,如果陳述模糊或不相關,則用黃色

盡管在問題4.1中出現了部分幻覺,ChatGPT給出了相當好的類比。作者進一步評估新知識在語境中的整合,測試了新的與已知的口袋妖怪的戰斗。結果表明,ChatGPT能夠重用先驗和新引入的知識來預測結果,即使涉及的兩個口袋妖怪都是新引入的。在這種情況下,模型給出了可靠的預測。

通過與ChatGPT在對話框架下的互動,可以得出以下結論:首先,模型所呈現的事實的準確性取決于之前討論的內容;其次,對抗性攻擊可能是成功的,但并不總是成功的,但一般來說,對話預處理(知識檢索)和協作反饋可以糾正先前模型的錯誤。
責任編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4314

    瀏覽量

    85842
  • 模型
    +關注

    關注

    1

    文章

    3243

    瀏覽量

    48836
  • ChatGPT
    +關注

    關注

    29

    文章

    1560

    瀏覽量

    7666

原文標題:在口袋妖怪世界中理解ChatGPT的思維

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【國產FPGA+OMAPL138開發板體驗】(原創)6.FPGA連接ChatGPT 4

    OMAP-L138(定點/浮點DSP C674x+ARM9)+ FPGA處理器的開發板。 編寫一個用于FPGA訪問ChatGPT 4的程序代碼是一個相當復雜的任務,涉及到硬件設計、網絡通信、數據處理等多個
    發表于 02-14 21:58

    在FPGA設計中是否可以應用ChatGPT生成想要的程序呢

    當下AI人工智能崛起,很多開發領域都可看到ChatGPT的身影,FPGA設計中,是否也可以用ChatGPT輔助設計呢?
    發表于 03-28 23:41

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    無縫切換的場景為特色,高精度處理細微的查詢。 · 實時數據分析和報告 :在特別引起業務分析師共鳴的演示中,ChatGPT-4o處理了大型數據集,以提取可操作的見解,具備顯著加快決策的潛力。 新功能摘要
    發表于 05-27 15:43

    chatGPT幫我寫硬件代碼,是懂行的,好助手!#chatgpt #物聯網開發 #python開發板

    ChatGPT
    蘇州煜瑛微電子科技有限公司
    發布于 :2023年02月17日 15:27:42

    ChatGPT對話語音識別

    ChatGPT
    YS YYDS
    發布于 :2023年05月30日 22:13:10

    柵漏電流噪聲有哪幾種模型?這幾種模型具有什么特性和局限性?

    柵漏電流噪聲特性是什么?柵漏電流噪聲有哪幾種模型?這幾種模型具有什么特性和局限性?
    發表于 04-14 06:53

    科技大廠競逐AIGC,中國的ChatGPT在哪?

    最近,AI(人工智能)圈一股以“ChatGPT”為核心的熱潮從美國“硅谷”涌入中國。 2022年11月底,初創公司OpenAI發布了名為ChatGPT的對話式聊天機器人模型,一經推出,便在網絡上
    發表于 03-03 14:28

    不到1分鐘開發一個GPT應用!各路大神瘋狂整活,網友:ChatGPT就是新iPhone

    人類。 總之,雖然ChatGPT等語言模型的應用在一定程度上改變了我們的生活和學習方式,但它們并不能完全替代人類進行創造性思考和創造性活動。我們不能將它們簡單地視為新iPhone之類的產品,而是應該理性看待它們的應用價值和技術局限性。
    發表于 11-19 12:06

    基于微控制器的LED驅動器拓撲、權衡和局限

    本文主要探討基于微控制器的LED驅動器。它考察了以微控制器作為系統核心所能采用的各種不同拓撲結構。它還詳細討論了各種拓撲的權衡,著重于它們的主要特性和局限:通訊、電壓
    發表于 10-26 14:17 ?910次閱讀
    基于微控制器的LED驅動器拓撲、權衡<b class='flag-5'>和局限</b>

    法國研究超薄太陽能電池的潛力和局限性,未來應用將不受限制

    法國的一項新研究強調了超薄光伏電池的潛力,但商業化生產的道路將充滿挑戰。研究人員提出了一系列整合光子和電子元素的新型細胞結構。
    的頭像 發表于 11-16 17:02 ?1739次閱讀

    ChatGPT在自然語言處理中的局限性和挑戰

    ChatGPT在自然語言處理中仍然存在著一些局限性和挑戰。本文將探討ChatGPT在自然語言處理中的局限性和挑戰,并分析其背后的原因。
    的頭像 發表于 04-18 16:25 ?1421次閱讀

    碳化硅二極管的優點和局限性分析

    碳化硅二極管的優點和局限性分析 碳化硅(SiC)二極管是一種新型半導體材料,在高頻電源電子裝置中得到了廣泛應用。與傳統的硅(Si)材料相比,碳化硅二極管具有許多優點和局限性。下面是對碳化硅二極管
    的頭像 發表于 12-21 11:31 ?2610次閱讀

    超導材料在輸電領域的應用前景、優勢和局限

    超導材料適合作為輸電導線的潛力一直備受矚目。與傳統的金屬材料相比,超導材料具有低電阻和高電流載流能力的獨特優勢。本文將深入探討超導材料在輸電領域的應用前景、優勢和局限性。 在高科技時代,全球對電能
    的頭像 發表于 01-17 11:29 ?1581次閱讀

    WDM技術的缺點和局限

    和效率。然而,盡管WDM技術具有諸多優勢,但它也存在一些缺點和局限性。以下是對WDM技術缺點和局限性的詳細分析:
    的頭像 發表于 08-09 11:42 ?794次閱讀

    ChatGPT 適合哪些行業

    ChatGPT 是一種基于人工智能的自然語言處理技術,它能夠理解和生成人類語言。這種技術在多個行業中都有廣泛的應用潛力。以下是一些ChatGPT特別適合的行業,以及它在這些行業中可能的應用方式
    的頭像 發表于 10-25 16:11 ?449次閱讀
    主站蜘蛛池模板: 999伊人| 天天操狠狠| 久久作爱视频| 亚洲91色| 免费看黄色片的软件| 天天爽夜夜爽精品视频一| miya亚洲私人影院在线| 天堂成人网| 成 人 免费 网站| 777欧美| 四虎最新紧急入口4hu| 成人精品一区二区三区电影| www.免费| 五月婷色| 一级特黄aaa免费| susu成人影院| 欧美3d成人动画在线| 三级黄网| 亚洲色图日韩| 97九色| 欧美日韩一区二区三区毛片| 免费人成年短视频在线观看免费网站 | 国产精品丝袜xxxxxxx| 欧美日韩看片| 天天碰视频| 欧美男女交性过程视频| 免费一级毛片视频| 欧美一级视频在线高清观看| 久久人人澡| 久久久精品免费视频| 日本综合在线| h文 超乳 奶水| 国产网红精品| 波多野结衣一级毛片| 色婷五月| 天天干天天草天天射| 久久99久久99精品免观看| 久久夜色精品国产噜噜| 国产香蕉一区二区精品视频| 亚洲美女激情视频| a毛片网站|