OpenAI發(fā)布了一個“逆天”的AI模型——GPT2整個模型包含15億個參數(shù)

上個月，OpenAI發(fā)布了一個“逆天”的AI模型——GPT2，整個模型包含15億個參數(shù)。你給它一句話，它能給你編出一篇文章來。

OpenAI的研究主管Dario Amodei表示，GPT2是在一個包含大約1000萬篇文章的數(shù)據(jù)集上進行培訓的，比之前最先進的AI模型大12倍，數(shù)據(jù)集大15倍。

有這么厲害？看看他的實力水平不就知道了，OpenAI給出了這么一個開頭：

在一項研究中，科學家們發(fā)現(xiàn)了一群獨角獸，它們生活在安第斯山脈一個偏遠的還沒被開發(fā)山谷中，更令人驚訝的是這些獨角獸會說一口流利的英語

就這么一句話，GPT-2能寫出以下這么一大段故事：

因為它們獨特的角，科學家們將他們命名為Ovid’s Unicorn，這些四角、銀色角的獨角獸是原來科學家所不曾見過的。

......中間還編寫了，這些獨角獸是如何被發(fā)現(xiàn)的，以及業(yè)內(nèi)權(quán)威人士認為這些生物是如何出現(xiàn)的，最后還表明要驗證這群獨角獸是否為外星種族，唯一的方法可能就是通過DNA。

這一本正經(jīng)的胡說八道，說的猿妹我都信以為真

能有這樣出色的表現(xiàn)，不是沒有原因的，GPT-2各種特定領(lǐng)域的語言建模任務(wù)中都取得了很好的分數(shù)。作為一個沒有經(jīng)過任何領(lǐng)域數(shù)據(jù)專門訓練的模型，它的表現(xiàn)，比那些專為特定領(lǐng)域數(shù)據(jù)集（例如維基百科，新聞，書籍）上訓練的模型。有圖有真相：

除了能用于語言建模，GPT-2在問答、閱讀理解、摘要生成、翻譯等等任務(wù)上也都有非常好的成績，openAI在博客上也給出了示例，感興趣的可以前往查看（地址：https://blog.openai.com/better-language-models/）

除了以上提到的這些優(yōu)異表現(xiàn)，最主要的是GPT-2還學習幾種編程語言的語法模型，比如PHP和JavaScript。

它寫出來的JavaScript長這樣：

還有PHP語言：

就連Facebook AI研究院的Tim Rockt?schel看了GPT-2寫出來的代碼都表示：我們要有大麻煩了

話雖如此，該博客下面也有人表示其實，GPT-2寫的代碼不夠嚴謹，容易把js、C++、Python等語言混為一談。但實力依然不可小覷

目前，GPT-2已經(jīng)在GitHub上獲得4116個Star，674個Fork（地址：https://github.com/openai/gpt-2），喜歡的人可以嘗試一下

不過，OpenAI 的研究人員們決定不發(fā)布訓練模型的數(shù)據(jù)、也不發(fā)布最大那個模型預訓練后的參數(shù)，因為他們認為如此強力的模型有遭到惡意濫用的風險。最后，你們?nèi)绾慰创@個項目呢？

阅读全文

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
33553

瀏覽量
274149
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1221

瀏覽量
25193
獨角獸

獨角獸

+關(guān)注

關(guān)注
0

文章
197

瀏覽量
26811

原文標題：這個開源AI逆天了！編故事問答翻譯樣樣行，最主要的是還會寫代碼

文章出處：【微信號：TheBigData1024，微信公眾號：人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

【飛騰派4G版免費試用】仙女姐姐的嵌入式實驗室之五~LLaMA.cpp及3B“小模型”O(jiān)penBuddy-StableLM-3B

預訓練語言模型。該模型最大的特點就是基于以較小的參數(shù)規(guī)模取得了優(yōu)秀的性能，根據(jù)官網(wǎng)提供的信息，LLaMA的模型包含4

發(fā)表于 12-22 10:18

迄今最大模型？OpenAI發(fā)布參數(shù)量高達15億的通用語言模型GPT-2

史上最強“通用”NLP模型來襲：今天OpenAI在官博介紹了他們訓練的一個大規(guī)模無監(jiān)督NLP模型

發(fā)表于 02-16 08:43 ?4299次閱讀

OpenAI發(fā)布一款令人印象深刻的語言模型GPT-2

今年2月，OpenAI發(fā)布了一款令人印象深刻的語言模型GPT

發(fā)表于 05-17 18:48 ?4646次閱讀

OpenAI宣布，發(fā)布了7.74億參數(shù)GPT-2語言模型

就在本周，OpenAI宣布，發(fā)布了7.74億參數(shù)GPT-2語言

發(fā)表于 09-01 09:10 ?3150次閱讀

谷歌訓練開發(fā)一個萬億參數(shù)的AI語言模型

參數(shù)是機器學習算法的關(guān)鍵。它們是從歷史訓練數(shù)據(jù)中學到的模型的一部分。一般來說，在語言領(lǐng)域，參數(shù)的數(shù)量和復雜性之間的相關(guān)性非常好。例如，

發(fā)表于 01-18 16:19 ?1941次閱讀

谷歌開發(fā)出一個新的語言模型，包含了超過1．6萬億個參數(shù)

的AI模型GPT-3。GPT-3就是在570 GB的文本數(shù)據(jù)上訓練的語言模型，因此，就訓練數(shù)據(jù)和生成能力而言，

發(fā)表于 01-19 15:29 ?1962次閱讀

一個GPU訓練一個130億參數(shù)的模型

現(xiàn)在的模型動輒數(shù)百、數(shù)千億參數(shù)，普通人訓不動怎么辦？前不久，谷歌發(fā)布了參數(shù)量為 1.6 萬億的語言模型

發(fā)表于 02-11 09:04 ?2570次閱讀

浪潮、英偉達微軟相繼發(fā)布2500億、5300億參數(shù)的巨量模型，超過GPT-3

Turing-NLG相繼出現(xiàn)。 ? 2020年6月OpenAI在發(fā)布了GPT-3，這是當時訓練的最大模型，具有1750

發(fā)表于 10-18 14:41 ?3772次閱讀

ChatGPT升級　OpenAI史上最強大模型GPT-4發(fā)布

ChatGPT升級史上最強大模型GPT-4發(fā)布 OpenAI正式推出了ChatGPT升級版本，號稱史上最強大模型

發(fā)表于 03-15 18:15 ?3029次閱讀

State of GPT：大神Andrej揭秘OpenAI大模型原理和訓練過程

你可以看到，Llama 的參數(shù)數(shù)量大概是 650 億。現(xiàn)在，盡管與 GPT3 的 1750 億個參數(shù)

發(fā)表于 05-30 14:34 ?1209次閱讀

DeepSpeed結(jié)合Megatron-LM訓練GPT2模型筆記

本文基于DeepSpeedExamples倉庫中給出的Megatron相關(guān)例子探索一下訓練GPT2模型的流程。主要包含3個部分，第

發(fā)表于 06-19 14:45 ?4008次閱讀

ChatGPT重磅更新　OpenAI發(fā)布GPT-4 Turbo模型價格大降2/3

ChatGPT重磅更新 OpenAI發(fā)布GPT-4 Turbo模型價格大降2/3 目前OpenAI

發(fā)表于 11-07 18:20 ?3015次閱讀

聯(lián)發(fā)科天璣9300最高可運行330億參數(shù)AI大模型

聯(lián)發(fā)科天璣9300最高可運行330億參數(shù)AI大模型聯(lián)發(fā)科這個是要把AI大

發(fā)表于 11-07 19:00 ?1873次閱讀

人手一個的AI是如何誕生的?

2023年是AI大語言模型爆發(fā)的一年，以OpenAI推出的GPT大模型為起始，

發(fā)表于 07-23 10:33 ?364次閱讀

OpenAI即將推出GPT-5模型

OpenAI首席執(zhí)行官奧爾特曼近日宣布了一項重要消息：OpenAI將在今年未來幾個月內(nèi)推出全新的GPT-5

發(fā)表于 02-13 11:21 ?468次閱讀

发布文章

精選推薦
更多

文章

資料

帖子

邊緣AI MPU深度盤點：品牌、型號與技術(shù)特性全解析

eeDesigner
18小時前

288 閱讀

晶圓揀選測試的具體過程和核心要點

中科院半導體所
19小時前

308 閱讀

基于瑞薩電子RA8D1 MCU的USB和I2S數(shù)字音頻應(yīng)用解決方案

瑞薩MCU小百科
20小時前

327 閱讀

RZT2H CR52雙核BOOT流程和例程代碼分析

RA生態(tài)工作室
27天前

271 閱讀

使用e2studio軟件新建瑞薩RA系列MCU工程

瑞薩MCU小百科
20小時前

261 閱讀

PICkit單片機編程器用戶指南

剪刀腳
1.08 MB

10積分

112下載

通信系統(tǒng)_西蒙赫金

小十_
16.6 MB

免費

0下載

開關(guān)電源的基礎(chǔ)介紹和自激式與它激式及單片開關(guān)電源的詳細說明

sir
7.08 MB

免費

26下載

基于openharmony適配移植的傳感器相關(guān)功能用法

姚小熊27
0.83 MB

免費

4下載

RabbitRpc基于spring cloud的微服務(wù)rpc調(diào)用

李林
0.12 MB

2積分

1下載

【五一打卡】勞動最光榮！分享勞動風采，把小智AI套件帶回家

dianzi_0101
3天前

636 閱讀

【RA-Eco-RA4M2開發(fā)板評測】定時器輔助串口不定長數(shù)據(jù)接收

wang123a
1天前

427 閱讀

【米爾-STM32MP257開發(fā)板試用體驗】米爾-STM32MP257開發(fā)板下載yocto源碼和編譯及燒錄

jf_67024233
1天前

367 閱讀

請問一下是不是LMX2541只有輸入為整數(shù)時才能被鎖定

jf_94493343
1天前

417 閱讀

【RA-Eco-RA4M2開發(fā)板評測】使用Jlink的RTT來實現(xiàn)串口打印功能

jf_43382582
1天前

454 閱讀

推薦專欄
更多