在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

“中國的ChatGPT”真的要來了嗎?

中科曙光 ? 來源:量子位 ? 2023-03-21 10:41 ? 次閱讀

席卷全球的新風口

OpenAI去年發布了聊天機器人模型ChatGPT,它能夠理解和生成人類語言,并在許多自然語言處理任務中表現非常出色。據統計,上線僅兩個月,ChatGPT活躍用戶已經超億,打破了由TikTok創造的9個月實現億級用戶注冊的紀錄,引起了各行各業人們的強烈關注。就連埃隆·馬斯克也忍不住發推表示,ChatGPT厲害得嚇人,我們距離危險而強大的AI不遠了。當然,在一頓痛批ChatGPT之后,馬斯克也準備親自下場,成立研究實驗室,開發ChatGPT的競品。

類ChatGPT模型的開發與應用,在國內也迅速成為資本市場關注、創業者紛紛入場的賽道。阿里、百度等互聯網大廠,科大訊飛等語音類AI企業,以及眾多創業者都希望乘著最新的風口迅速“起飛”。創業者大軍中不乏像前美團聯合創始人王慧文、出門問問CEO李志飛、搜狗前CEO王小川、前京東技術掌門人周伯文等行業大佬。開發出“中國的ChatGPT”儼然成了國內科技圈“All in”的方向。

然而,我們真的能迅速見到一個“中國的ChatGPT”嗎?誰又能拔下頭籌,成為這個細分賽道的領頭羊呢?

這個眾多大佬都擠進來“淘金”的賽道,一定不是簡簡單單就能搞定的。

OpenAI的GPT“家族”

在深入了解開發出比肩ChatGPT的模型需要面臨哪些挑戰之前,讓我們先看下ChatGPT所屬的GPT模型家族都有哪些成員。

GPT-1發布于2018年6月,包含117M個參數。這是第一個采用基于Transformer的模型架構進行預訓練的模型。它在語言模型和單詞類比任務上表現出色。

GPT-2發布于2019年2月,包含1.5B個參數。這個模型在自然語言生成任務上表現出色,可以生成高質量的文章、新聞報道和詩歌等文本。

GPT-3發布于2020年6月,包含175B個參數。具有出色的通用性和創造性,可以在各種 NLP任務上表現出色,包括文本生成、問答、機器翻譯等任務。

到這就結束了?完全不是。

在GPT-3系列模型(注意,是一系列模型哦)發布之后,OpenAI繼續基于原始的GPT-3進行了不斷地完善。我們熟知的InstructGPT和ChatGPT實際的內部代號是text-davinci-003 175B和text-chat-davinci-002-20221122,是基于GPT-3.5的改良版。

d3ec54e6-c4c8-11ed-bfe3-dac502259ad0.png

圖:GPT-3模型家族,圖片來源:https://lifearchitect.ai/chatgpt/

在InstructGPT的訓練中,OpenAI的研究員引入了RLHF(Reinforcement Learning from Human Feedback,人類反饋強化學習)機制。這一訓練范式增強了人類對模型輸出結果的調節,并且對結果進行了更具理解性的排序。在此基礎上,ChatGPT還引入了“無害化”機制,防止模型生成不符合規范或倫理的答案。

d4059762-c4c8-11ed-bfe3-dac502259ad0.png

圖:GPT-3、InstructGPT、ChatGPT的“進化路線”

圖片來源:https://lifearchitect.ai/chatgpt/

不難看出,ChatGPT的出圈,與OpenAI多年的技術積累是分不開的。國內廠商想要開發出像ChatGPT一樣優秀的模型,也絕不是簡單依靠拉一波投資,雇一批算法研究員就能馬上實現的。

“中國的ChatGPT”面臨的挑戰

首先,在資金投入方面,在當前的技術水平下,訓練一個與ChatGPT這樣的大型語言模型相當的模型需要數百萬美元的投入。在發布ChatGPT之前,OpenAI可查的融資額已超過20億美元,也是如此龐大的投資才使OpenAI擁有了多年技術積累。反觀絕大多數近期入局的國內企業,即便擁有足夠的資金與人員,也大都很難在短期追上OpenAI的步伐。

我們不禁想問,如果要在國內開發出一個類ChatGPT模型,到底會面臨哪些技術挑戰呢?

為了能了解到最最準確的答案,我們請教了ChatGPT“本人”

d457fc82-c4c8-11ed-bfe3-dac502259ad0.png

1、數據量:需要大量的數據集來進行訓練。這些數據集需要是大規模的、多樣化的、真實的,并且要涵蓋各種不同的語言和語境。這需要花費大量的時間和資源來收集、整理和標注。

2、計算能力:需要非常強大的計算資源。這些模型需要在大規模的數據集上進行訓練,并且需要進行大量的參數優化和調整。這些計算需要高性能的計算機和高效的分布式計算框架。

3、 算法優化:需要對算法進行不斷的優化和改進。這包括優化網絡結構、調整超參數、使用更好的優化算法等。這需要對深度學習算法有深入的了解和經驗。

可以發現,這是一個涉及到多個領域和技術的復雜系統工程。只有同時在底層的基礎設施、針對性優化和大模型技術積淀都達到一定水平的情況下,才能夠研發出高質量的模型,并應用于各種場景中。

讓我們詳細看看這三類技術挑戰具體都意味著什么。

數據量

我們經常聽到“有多少數據,就有多少智能”,數據對于模型訓練的重要性不言而喻。類ChatGPT模型的訓練,更需要超大規模的,經過清洗的數據。以GPT-3的訓練為例,需要300B tokens的數據。大家如果對這個數字不敏感的話,可以參考整個英文的維基百科的數據量,只有“相對可憐”的3B tokens,是訓練GPT-3所需的百分之一。并且,要訓練出類ChatGPT模型,勢必需要數倍于當年訓練GPT-3的數據量的中文語料數據,這對于大部分企業或科研機構來說都是難以翻越的大山。有效的中文數據量,一定程度上決定了模型性能的上限。

計算能力

類ChatGPT模型的訓練,除了需要非常多的訓練數據外,也離不開龐大的算力支撐。根據北京智源人工智能研究院公布的數據,使用300B tokens的數據訓練175B參數規模(與GPT-3規模相同)的模型,如果使用96臺通過200Gb IB網卡互聯的DGX-A100節點,需要約50天。要是使用更大規模的訓練數據集,訓練時長還會進一步增加。

對于計算集群來說,不僅需要能夠提供海量的算力資源,還需要具備高速網絡和高容量存儲,以便支持大規模的數據訪問和模型傳輸。整套基礎設施,連同軟件平臺,還需要結合集群的拓撲結構針對分布式訓練進行優化,通過調整并行策略等方式,提升硬件利用率與通訊效率,縮短整體訓練時間。

算法優化

算法優化和模型的訓練效率和效果息息相關。每一個算法研究員,都希望模型在訓練過程中快速收斂,這恰恰也是算法研究人員經驗與企業長年技術積累的體現。通常情況下,在訓練的過程中需要不斷調整學習率、批量大小、層數等超參數,或使用自動調參的技巧和經驗,才能快速、穩定的實現模型收斂。就像中餐大廚們用“少許、適量”的調料制作美味佳肴一樣,里面包含著的是大廚們幾十年的手藝,不是一朝一夕就能被批量復制的。

前途是光明的,道路是曲折的

想必,這是最適合送給現在想要開發出“中國的ChatGPT”的各路大佬們的一句話了。為規避未來的技術風險,不少廠商、科研機構也開始探索在自研算力服務平臺上訓練的可行性。北京智源人工智能研究院作為國內頂尖的人工智能領域研究機構,早早就探索了使用自研算力服務平臺的可能性。同樣是使用300B tokens的數據訓練175B參數規模的模型,通過曙光提供的算力服務,訓練周期只需29.10天,在節點規模接近的情況下,訓練效率是其他算力平臺的300%。

基于自研算力服務平臺進行訓練,不可避免的會帶來更多的移植與調優工作。曙光智算強大的硬件與算法優化團隊,在集群、并行策略、算子、工具包等方面的優化上與智源開展了深入的合作。首先,為保證程序能夠正常運行,需要完成包括DeepSpeed/Megatron/Colossal-AI/apex等必要組件的適配工作。其次,程序系統順利調度通常也需要調整調整操作系統配置及tcp協議參數等。訓練的優化工作則主要包含以下三個方面:

算子層面:使用算子融合/算子優化等技術,深度挖掘硬件性能,提升硬件使用率;

策略層面:采用模型并行、數據并行、流水線并行、Zero等多級并行策略,實現超大規模訓練;

集群層面:針對硬件的拓撲結構,對分布式訓練通信、并行分組配比等進行定制優化,提升訓練擴展比。

通過一系列的優化方法,最終也證明了我們可以在自研算力服務平臺上,以能夠對標國際水平的效率實現大模型的開發工作,這無疑為“中國的ChatGPT”的開發工作喂了一顆定心丸。希望在不久的將來,我們可以看到真正在自研算力平臺上訓練的,能與ChatGPT比肩的中文模型。

前途一定是光明的。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3286

    瀏覽量

    49007
  • ChatGPT
    +關注

    關注

    29

    文章

    1566

    瀏覽量

    7886

原文標題:“中國的ChatGPT”真的要來了嗎?

文章出處:【微信號:sugoncn,微信公眾號:中科曙光】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ChatGPT新增實時搜索與高級語音功能

    在OpenAI的第八天技術分享直播中,ChatGPT的搜索功能迎來了重大更新。此次更新不僅豐富了ChatGPT的功能體系,更提升了其實用性和競爭力。 新增的實時搜索功能,是此次更新的亮點之一
    的頭像 發表于 12-17 14:08 ?245次閱讀

    怎樣搭建基于 ChatGPT 的聊天系統

    搭建一個基于ChatGPT的聊天系統是一個涉及多個步驟的過程,包括理解ChatGPT的API、設計用戶界面、處理數據和集成ChatGPT模型。以下是一個簡化的指南,用于創建一個基本的聊天系統。 1.
    的頭像 發表于 10-25 16:23 ?560次閱讀

    華納云:ChatGPT 登陸 Windows

    ChatGPT 桌面應用,您可以聊聊文件和照片。這款應用為您帶來了 OpenAI 最新的模型改進,包括訪問我們最新、最智能的模型OpenAI o1-preview 。” Windows 版 ChatGPT 應用可以在大多數 W
    的頭像 發表于 10-18 15:50 ?261次閱讀

    用launch pad燒錄chatgpt_demo項目會有api key報錯的原因?

    我用launch pad燒錄chatgpt_demo項目問題會有api key報錯;請問用launch pad要如何設置api key和調試?還是只能通過idf?
    發表于 06-27 07:59

    車路云協同,這次它真的來了嗎

    隨著科技的快速發展,“車路云協同”正在悄然發生變化。我們離科幻電影《機械公敵》中威爾?史密斯駕駛的汽車能準確甄別交通狀況并調整行駛狀態的時代就要來了嗎?背景說明“車路協同”已經不是什么新鮮名詞
    的頭像 發表于 06-13 08:25 ?543次閱讀
    車路云協同,這次它<b class='flag-5'>真的</b><b class='flag-5'>來了嗎</b>?

    降價潮背后:大模型落地門檻真的了嗎

    “比起價格門檻,AI大模型的應用門檻,更難跨越。”大模型爭相降價下,AI應用的門檻真的降低了嗎?答案還真不一定。因為除了價格門檻,AI大模型還有應用門檻。甚至,后者比前者更具挑戰性。B端業務場景向來
    的頭像 發表于 06-13 08:04 ?275次閱讀
    降價潮背后:大模型落地門檻<b class='flag-5'>真的</b>降<b class='flag-5'>了嗎</b>?

    使用espbox lite進行chatgpt_demo的燒錄報錯是什么原因?

    我使用espbox lite進行chatgpt_demo的燒錄 我的idf是v5.1release版本的,espbox是master版本的 在編譯時似乎沒有什么問題 在燒錄時報錯 請問這是什么原因
    發表于 06-11 08:45

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    功能和實際應用。 GPT-4 turbo****的增強功能 ChatGPT-4o帶來了幾個值得注意的升級,增強了性能和可用性: · 更快的響應時間和更高的準確性: 是客戶服務和其他快節奏環境中所
    發表于 05-27 15:43

    iOS版ChatGPT支持首選語言設置中文

    近日,iOS版ChatGPT來了1.2024.129版本的重要更新。此次更新最顯著的變化是新增了對App首選語言設置中文的支持,打破了之前僅限于其他語言的限制。
    的頭像 發表于 05-17 09:31 ?654次閱讀

    李開復:中國須獨立研發ChatGPT?

    李開復援引“ChatGPT 時刻”概念,指出美國在約 17 個月前就已體驗到這一波熱潮(注:ChatGPT 最早于 2022 年 12 月走紅)。然而,他認為中國尚未達到這一階段,目前國內的聊天機器人或工具仍有待改進。
    的頭像 發表于 05-13 16:05 ?542次閱讀

    OpenAI的AI搜索也要來了,但我們需要這么多AI搜索么

    OpenAI要做AI搜索挑戰谷歌這件事已經傳了很久,傳說中的SearchGPT似乎真的要來了。據軟件開發者TiborBlaho爆料,OpenAI的AI搜索產品Sonic-SNC(SearchGPT
    的頭像 發表于 05-10 08:05 ?348次閱讀
    OpenAI的AI搜索也<b class='flag-5'>要來了</b>,但我們需要這么多AI搜索么

    騰訊突然宣布,微信鴻蒙版要來了

    應用,僅支持鴻蒙內核和系統的應用,被稱為 “純血鴻蒙”而備受關注, 這意味著, 真正的國產手機操作系統要來了 ,而且影響力驚人, 一上線就是僅次于 Android 和 iOS 之后的全球第三大手機操作系統
    發表于 04-30 19:34

    蘋果折疊屏iPhone新專利獲批 蘋果折疊屏手機要來了嗎

    蘋果折疊屏iPhone新專利獲批 蘋果折疊屏手機要來了嗎? 我們看到蘋果公司折疊屏iPhone專利已經獲批;果粉都在期待的蘋果折疊屏手機要來了嗎?新專利也顯示蘋果已經找到了提升折疊屏耐用耐摔性的方法
    的頭像 發表于 04-17 17:05 ?1335次閱讀

    在FPGA設計中是否可以應用ChatGPT生成想要的程序呢

    當下AI人工智能崛起,很多開發領域都可看到ChatGPT的身影,FPGA設計中,是否也可以用ChatGPT輔助設計呢?
    發表于 03-28 23:41

    【國產FPGA+OMAPL138開發板體驗】(原創)6.FPGA連接ChatGPT 4

    ); FPGA:“問題已發送,等待回復...”(FPGA緊張地搓手) answer = ReceiveFromServer(chatGPT_Server); FPGA:“啊!回復來了!”(FPGA眼睛一亮
    發表于 02-14 21:58
    主站蜘蛛池模板: miya亚洲私人影院在线| 黄色网 在线播放| 天天射天天草| 日日操夜夜骑| 精品国产午夜久久久久九九| 国产黄色录像视频| 欧美极品在线| 男人j进女人j的视频一进一出| 最新色视频| 特级毛片视频在线| 拍拍拍美女黄色1000视频 | 欧美性色xo影院永久禁欲| 最新日本免费一区二区三区中文| 亚洲色图 在线视频| 色偷偷88欧美精品久久久| 免费人成在线| 国产高清视频免费最新在线| 无毒不卡在线观看| www.av毛片| 免费爱做网站在线看| 午夜看大片| 久久青草国产精品一区| 免费视频h| 亚洲国产视频网| 亚洲人成在线精品不卡网| 69 hd xxxx日本| 伊人久久大香线蕉综合电影| 日产精品卡二卡三卡四卡乱码视频 | 天天插天天干天天操| 成人夜色香网站在线观看| 亚洲光棍天堂| 色天使在线观看| 国产在线精品美女观看| 天天插天天插| 69日本xxxxxxxxx29| 新激情五月| 久久久久毛片成人精品| 天天躁日日躁狠狠躁一级毛片| 午夜黄| 亚洲国产人成在线观看| 美女视频黄色的免费|