12月1日,阿里云通義千問720億參數模型Qwen-72B宣布開源。與此同時,他們還開源了18億參數模型Qwen-1.8B和音頻大模型Qwen-Audio。
據了解,Qwen-72B是基于3T tokens高質量數據進行訓練的模型,在10個權威基準測試中表現出色,超越了閉源的GPT-3.5和GPT-4。
阿里云是國內最早開源自研大模型的科技企業,通義千問是第一個全尺寸開源的大模型,從18億、70億、140億到720億參數規模。用戶可以在魔搭社區直接體驗Qwen系列模型的效果,也可以通過阿里云靈積平臺調用模型API,或者在阿里云百煉平臺上定制大模型應用。此外,阿里云人工智能平臺PAI為通義千問全系列模型提供了輕量級微調、全參數微調、分布式訓練、離線推理驗證、在線服務部署等服務。
開源模型Qwen-1.8B在推理2K長度的文本內容時只需3G顯存,可以在消費級終端上進行部署。而Qwen-Audio可以感知和理解各種語音信號,包括人聲、自然聲、動物聲和音樂聲等。用戶可以輸入一段音頻,并要求模型對音頻進行理解,甚至進行文學創作、邏輯推理和故事續寫等任務。
阿里云CTO周靖人表示,開源生態對于推動中國大型模型的技術進步和應用實踐至關重要。通義千問將繼續投入開源,并希望成為“AI時代最開放的大型模型”,與合作伙伴共同推動大型模型生態建設。
審核編輯:黃飛
-
人工智能
+關注
關注
1791文章
47352瀏覽量
238791 -
GPT
+關注
關注
0文章
354瀏覽量
15414 -
阿里云
+關注
關注
3文章
961瀏覽量
43097 -
大模型
+關注
關注
2文章
2476瀏覽量
2813
發布評論請先 登錄
相關推薦
評論