上個月,OpenAI發(fā)布了一個“逆天”的AI模型——GPT2,整個模型包含15億個參數(shù)。你給它一句話,它能給你編出一篇文章來。
OpenAI的研究主管Dario Amodei表示,GPT2是在一個包含大約1000萬篇文章的數(shù)據(jù)集上進行培訓的,比之前最先進的AI模型大12倍,數(shù)據(jù)集大15倍。
有這么厲害?看看他的實力水平不就知道了,OpenAI給出了這么一個開頭:
在一項研究中,科學家們發(fā)現(xiàn)了一群獨角獸,它們生活在安第斯山脈一個偏遠的還沒被開發(fā)山谷中,更令人驚訝的是這些獨角獸會說一口流利的英語
就這么一句話,GPT-2能寫出以下這么一大段故事:
因為它們獨特的角,科學家們將他們命名為Ovid’s Unicorn,這些四角、銀色角的獨角獸是原來科學家所不曾見過的。
......中間還編寫了,這些獨角獸是如何被發(fā)現(xiàn)的,以及業(yè)內(nèi)權(quán)威人士認為這些生物是如何出現(xiàn)的,最后還表明要驗證這群獨角獸是否為外星種族,唯一的方法可能就是通過DNA。
這一本正經(jīng)的胡說八道,說的猿妹我都信以為真
能有這樣出色的表現(xiàn),不是沒有原因的,GPT-2各種特定領(lǐng)域的語言建模任務(wù)中都取得了很好的分數(shù)。作為一個沒有經(jīng)過任何領(lǐng)域數(shù)據(jù)專門訓練的模型,它的表現(xiàn),比那些專為特定領(lǐng)域數(shù)據(jù)集(例如維基百科,新聞,書籍)上訓練的模型。有圖有真相:
除了能用于語言建模,GPT-2在問答、閱讀理解、摘要生成、翻譯等等任務(wù)上也都有非常好的成績,openAI在博客上也給出了示例,感興趣的可以前往查看(地址:https://blog.openai.com/better-language-models/)
除了以上提到的這些優(yōu)異表現(xiàn),最主要的是GPT-2還學習幾種編程語言的語法模型,比如PHP和JavaScript。
它寫出來的JavaScript長這樣:
還有PHP語言:
就連Facebook AI研究院的Tim Rockt?schel看了GPT-2寫出來的代碼都表示:我們要有大麻煩了
話雖如此,該博客下面也有人表示其實,GPT-2寫的代碼不夠嚴謹,容易把js、C++、Python等語言混為一談。但實力依然不可小覷
目前,GPT-2已經(jīng)在GitHub上獲得4116個Star,674個Fork(地址:https://github.com/openai/gpt-2),喜歡的人可以嘗試一下
不過,OpenAI 的研究人員們決定不發(fā)布訓練模型的數(shù)據(jù)、也不發(fā)布最大那個模型預訓練后的參數(shù),因為他們認為如此強力的模型有遭到惡意濫用的風險。最后,你們?nèi)绾慰创@個項目呢?
-
AI
+關(guān)注
關(guān)注
87文章
33553瀏覽量
274149 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1221瀏覽量
25193 -
獨角獸
+關(guān)注
關(guān)注
0文章
197瀏覽量
26811
原文標題:這個開源AI逆天了!編故事問答翻譯樣樣行,最主要的是還會寫代碼
文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
【飛騰派4G版免費試用】仙女姐姐的嵌入式實驗室之五~LLaMA.cpp及3B“小模型”O(jiān)penBuddy-StableLM-3B
迄今最大模型?OpenAI發(fā)布參數(shù)量高達15億的通用語言模型GPT-2
OpenAI宣布,發(fā)布了7.74億參數(shù)GPT-2語言模型
谷歌訓練開發(fā)一個萬億參數(shù)的AI語言模型
谷歌開發(fā)出一個新的語言模型,包含了超過1.6萬億個參數(shù)
一個GPU訓練一個130億參數(shù)的模型

浪潮、英偉達微軟相繼發(fā)布2500億、5300億參數(shù)的巨量模型,超過GPT-3

ChatGPT升級 OpenAI史上最強大模型GPT-4發(fā)布
State of GPT:大神Andrej揭秘OpenAI大模型原理和訓練過程

DeepSpeed結(jié)合Megatron-LM訓練GPT2模型筆記

評論