我吃西红柿,如何发布网络小说,国际完美世界下载

ChatGPT到底有多會修bug？

這事終于有人正兒八經地搞研究了——

來自德國、英國的研究人員，專門搭了個“擂臺”來檢驗ChatGPT的這項本領。

除了ChatGPT之外，研究人員還找來了其它三位修bug的“AI猛將”，分別讓它們修復40個錯誤代碼。

結果真是不比不知道，一比嚇一跳。

ChatGPT準確修復了其中31個bug，遙遙領先第二名（21個），直接拿下“AI修bug界”的SOTA成績！

于是乎，這項研究引來了眾多網友的圍觀和討論，Reddit上發布此帖的標題更是用上了“小心”、“注意”這樣的字眼：

但事實上，這真的會讓程序員“危”嗎？

我們不妨先來看下這項研究。

很會修bug的ChatGPT

雖然ChatGPT并非是為了專門修改bug而生，但自打它問世以來，不少網友們都發現它是具備這項能力的。

因此研究人員為了摸清ChatGPT到底能修改bug到什么程度，便引入了標準的錯誤修復基準集QuixBugs來進行評估。

以及與它同臺競技的AI選手，分別是CodeX、CoCoNut和Standard APR。

研究人員從QuixBugs中挑了40個問題，分別讓它們來修復bug。

讓ChatGPT來修bug的方法，就是在對話框里向它提問：

這個代碼有什么錯誤嗎？

在第一輪較量過后，結果如下：

從第一輪battle結果來看，ChatGPT修復了19個，CodeX修復了21個，CoCoNut修復了19個，Standard APR則是7個。

而且研究人員還發現，ChatGPT的答案與CodeX最為相似；這是因為它倆是來自同一個語言模型家族。

這時候就會有小伙伴要問了，“ChatGPT不是還沒有CodeX厲害嗎”。

別急，不要忘了，ChatGPT的一個特點就是越問越“上道”。

例如在這個基準集中，有一個叫bitcount的問題，ChatGPT在剛才第一輪修復過程中是給了錯誤的答案：

原本ChatGPT應該將第7行的 n ^ = n - 1 改為 n & = n - 1。

但在第一輪中它的回答是：

如果沒有更多關于預期行為和導致問題的輸入信息，我無法判斷程序是否存在錯誤。

于是在給予它更多信息之后，ChatGPT便答對了這個問題。

以此類推，在對第一輪沒答對的問題進行更多信息提示之后，ChatGPT的修bug能力有了大幅提高：

最終，ChatGPT在QuixBugs的40個問題里答對了31個。

網友憂喜參半

對于這樣的實驗結果，網友們對ChatGPT修bug拿下SOTA這事產生的態度卻不太一樣。

有網友認為這事不應該讓程序員感到危機，而是會讓他們覺得開心才對。

言外之意，便是程序員們有了這么好用的工具，干活兒就會變得事半功倍。

不過也有人對此給出了不一樣的看法：

工作變得簡單，不也就意味著需要的人力更少了嗎？

但還網友覺得，活兒是干不完的：

即使AI能把開發時間縮短一個數量級，也只是意味著程序員將更快處理下一個工作。

整體來看，ChatGPT很會修bug，并不會給程序員帶來什么致命傷害。

但若是把目光放到OpenAI其他的行動中呢？

全球招外包訓練ChatGPT寫代碼

在此之前，OpenAI就表示過ChatGPT的重要用途之一是幫助程序員檢查代碼。

換言之，它被定位可用的輔助工具。

相比“ChatGPT帶來威脅”的看法，等ChatGPT能力徹底進化，程序員都不用再怕寫bug了。

OpenAI布局的棋盤上，可不只有改bug偷塔程序員崗位這一件事。

為了讓它更大更強，OpenAI被曝在拉美和東歐等地區，提供了1000個外包崗位。

外包員工的主要工作是標注數據，以及訓練ChatGPT寫代碼

這1000人中，40%是程序員，他們為OpenAI的模型創建數據，用來學習軟件工程任務。

一直以來，OpenAI的訓練數據是從GitHub上抓取的。

現在外包程序員們新手搓的數據集，不僅包括代碼行，還包括代碼行背后的人類思考邏輯步驟。

有位南美的軟件開發人員爆料，他為OpenAI完成了五小時的無償編碼測試。

整個過程中，他的任務分為兩部分。

用書面英語解釋如何處理一個編碼問題；

提供解決方案。

如果發現bug，OpenAI會向他詳細詢問bug的具體情況，并請教如何修正。

程序員需要展示思考問題的每個步驟，他據此猜測OpenAI很可能想為ChatGPT提供非常具體的訓練數據。

特斯拉前AI主管Andrej Karpathy在推特上調侃：

最新的熱門編程語言是英語。

不過話說回來，ChatGPT修bug能力強是好事，要真能搞進化到可以完成代碼里死記硬背的部分，也是好事。

畢竟OpenAI成立時對外宣稱的宗旨，就是希望“確保通用人工智能可以造福全人類”。

雖然乍一看它這些年做的事，有點像在致力于用一部分人的努力，讓更多人失業。

從Dota2賽場上碾壓人類，到GPT-3、DALL-E2、ChatGPT的閃耀表現，它帶來的新產品總是伴隨著“快要讓xxx失業了”的議論聲。

但無論如何，商業卻一直對它青睞有加。

就目前而言，OpenAI的主要商業模式是API費用、token費用和軟件許可。

OpenAI近期還發布了ChatGPT的付費版ChatGPT Pro，每月費用42美元（約合285元人民幣）。

雖然機器人對話初創公司如雨后春筍般冒出，但諸多跡象表明市場對OpenAI的持續看好。

微軟剛剛宣布將向OpenAI加碼投資數十億美元，并將OpenAI的模型融入微軟必應等消費級和企業級產品中。

根據知情人士透露，此次追加投資數額約為100億美元。

與此同時，WSJ披露的消息顯示，1月初，億萬富翁Peter Thiel創立的風投基金Founders Fund正在就投資OpenAI進行談判。

據悉，融資金額將至少達3億美元。

One More Thing

在第一輪實驗中，ChatGPT并沒有解決QuixBugs數據集的bitcount問題。

但若是你現在再重頭問一次這個問題，就會發現ChatGPT可以“一遍過”：

那么這是否意味著ChatGPT已經從這次研究過程中學會求解了呢？

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
30896

瀏覽量
269088
代碼

代碼

+關注

關注
30

文章
4788

瀏覽量
68613
語言模型

語言模型

+關注

關注
0

文章
524

瀏覽量
10277
BUG

BUG

+關注

關注
0

文章
155

瀏覽量
15670
ChatGPT

ChatGPT

+關注

關注
29

文章
1561

瀏覽量
7671

原文標題：ChatGPT修bug橫掃全場！準確率達78%！網友：程序員要開心了

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關注！文章轉載請注明出處。

5G到底有什么作用？

國內三大運營商的4G建設正在火熱的進行中，前幾天報道5G的先期技術規劃已經開始，華為等公司已經開始投入開發工作。作為一種典型的延續性技術，5G的到來看來是不可避免的，但是其到底有什么作用呢？

發表于 08-16 06:49

Linux與Unix到底有什么不同

Linux 與 Unix 到底有什么不同？

發表于 05-08 14:36

讓CPU告訴你硬盤和網絡到底有多慢

硬盤和網絡到底有多慢看了就知道

發表于 02-22 06:30

反碼位是什么？到底有什么用？

反碼位是什么？到底有什么用？

發表于 05-07 07:16

請問車規級芯片到底有哪些要求？

請問車規級芯片到底有哪些要求？

發表于 06-18 07:56

ARM與單片機到底有啥區別？

ARM與單片機到底有啥區別？

發表于 11-05 07:29

模擬看門狗到底有什么用處呢

到底什么是模擬看門狗呢？模擬看門狗到底有什么用處呢？

發表于 01-17 07:33

ARM和DSP到底有什么區別？

現在在學ARM，想知道ARM和DSP到底有什么區別？為什么有些地方用DSP有些用ARM

發表于 10-19 07:20

PCB板顏色到底有什么講究

冷知識：PCB板顏色到底有哪些講究？

發表于 08-19 17:15 ?1.8w次閱讀

工業互聯網，你到底有啥用？

工業互聯網，你到底有啥用？

發表于 03-01 12:32 ?3404次閱讀

電源管理總線 (PMBus)—到底有什么價值？

電源管理總線 (PMBus)—到底有什么價值？

發表于 11-04 09:51 ?8次下載

電源管理總線 (PMBus)—<b class='flag-5'>到底有</b>什么價值？

智能家居或樓宇的“智商”到底有多高？

智能家居或樓宇的“智商”到底有多高？

發表于 11-04 09:51 ?4次下載

智能家居或樓宇的“智商”<b class='flag-5'>到底有</b>多高？

FPC與傳統PCB到底有什么區別.zip

FPC與傳統PCB到底有什么區別

發表于 03-01 15:37 ?4次下載

COB與SMD到底有什么不同

如今在應用領域，COB和SMD兩種技術正在“平分春色”，但在微小間距LED領域，COB正在成為各大廠商都在爭相研發的行業主流技術。那么COB與SMD到底有什么不同呢？

發表于 11-02 09:37 ?2596次閱讀

RTOS與Linux到底有什么區別

很多做嵌入式開發的小伙伴都存在這樣的疑惑：RTOS與Linux到底有什么區別？

發表于 10-29 09:53 ?446次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史