電子發(fā)燒友網(wǎng)報道(文/吳子鵬)北京時間3月15日凌晨,人工智能研究公司OpenAI正式發(fā)布了其下一代大型語言模型GPT-4。目前,ChatGPT的Plus訂閱用戶已經(jīng)可以使用GPT-4,其他用戶需要排隊申請內(nèi)測。
對于GPT-4的性能,很多國外網(wǎng)友的描述都是“GPT-4,起飛!”
多模態(tài)大型語言模型GPT-4
GPT-4被定義為OpenAI發(fā)展的另一里程碑,其相較于上一代產(chǎn)品GPT-3.5所帶來的提升是巨大的。OpenAI工作人員表示,“我們還在為機(jī)器學(xué)習(xí)模型設(shè)計的傳統(tǒng)基準(zhǔn)上對GPT-4進(jìn)行了評估。GPT-4大大超過現(xiàn)有的大語言模型,與多數(shù)最先進(jìn)的(SOTA)模型并駕齊驅(qū)。”
官方介紹稱,GPT-4作為一個多模態(tài)大模型(接受圖像和文本輸入,生成文本),主要在四個方面做了增強(qiáng)。
首先是可以更準(zhǔn)確地解決難題,具有更廣泛的常識和解決問題的能力。在GPT-3.5時代,ChatGPT的精準(zhǔn)度時常被吐槽。GPT-3.5根據(jù)從互聯(lián)網(wǎng)上搜羅的大量文章、網(wǎng)站和社交媒體帖子以及用戶與OpenAI雇用的人工雇員的實時英文對話進(jìn)行訓(xùn)練的,因此在輸出結(jié)果時,一些錯誤的源數(shù)據(jù),也導(dǎo)致ChatGPT給出的答案看似合理,實際上有很大的漏洞。就以考試來衡量,上一代GPT-3.5在很多專業(yè)考試中的成績都是倒數(shù)10%,而GPT-4在已測試的考試中,基本都是高分通過,超越了“人類的水平”。
GPT-4在多項考試中優(yōu)于GPT-3.5
其次是更具創(chuàng)造性和協(xié)作能力。在上一代基于GPT-3.5打造的ChatGPT中,很多問題給出的回答都是很簡短的,雖然具備一定的邏輯性,不過在專業(yè)人士看來還略顯“幼稚”。到了GPT-4,該模型能夠處理超過25000個(GPT-3.5是3000個)單詞的文本,允許長文內(nèi)容創(chuàng)建、擴(kuò)展對話以及文檔搜索和分析等用例。在顯示過程中,GPT-4可以完成總結(jié)文章、寫詩這樣的創(chuàng)造性任務(wù)。
第三點(diǎn)是GPT-4的高級推理能力更強(qiáng)。此前,基于GPT-3.5打造的ChatGPT,被很多使用者定義為“一本正經(jīng)的胡說八道”,在計算方面的能力更是弱于十四五歲的孩子,約等于八九歲孩子。因此,很多人說如果將ChatGPT比作是一個學(xué)生,他在數(shù)理化方面是嚴(yán)重偏科的。在GPT-4中,這方面的能力得到了顯著的增強(qiáng)。在專業(yè)測試和學(xué)術(shù)基準(zhǔn)測試中,GPT-4都表現(xiàn)出了不俗的實力。在官網(wǎng)上,OpenAI用會議預(yù)約展示了GPT-4的推理能力,GPT-4明顯更“擅長”做這個。
最后一點(diǎn)是安全性。針對基于GPT-3.5打造的ChatGPT,曾有內(nèi)測人員通過引導(dǎo)的方式讓其表現(xiàn)出攻擊性。同時,有很多報道都指出,上一代ChatGPT曾出現(xiàn)辱罵用戶、表白用戶、誘導(dǎo)用戶離婚、監(jiān)視開發(fā)人員等行為。有業(yè)內(nèi)人士在推特上表示,微軟需要關(guān)閉必應(yīng)中的類ChatGPT功能,因為系統(tǒng)有時表現(xiàn)得像精神病一樣,會給用戶錯誤答案。特斯拉馬斯克也表示,上一代ChatGPT是“不安全的”。OpenAI花了6個月時間使GPT-4更安全、更具一致性。在內(nèi)部評估中,與GPT-3.5相比,GPT-4對不允許內(nèi)容做出回應(yīng)的可能性降低82%,給出事實性回應(yīng)的可能性高40% 。
當(dāng)然,GPT-4也還存在自己的局限性,尤其是在事實性、社會偏見、幻覺和對抗性等方面,需要得到持續(xù)的優(yōu)化。在內(nèi)部的對抗性事實性評估中,GPT-4的得分比GPT-3.5高40%,很顯然這還是不夠的。
在發(fā)布會當(dāng)晚,微軟表示GPT-4已在新必應(yīng)搜索引擎上運(yùn)行。
全行業(yè)追趕GPT-4
ChatGPT的火熱是有目共睹的,在去年11月30日發(fā)布后的5天時間里,收獲了100萬用戶;推出僅僅2個月,月活躍用戶就成功過億,成為歷史上增長最快的消費(fèi)者應(yīng)用程序。如今,GPT-4的發(fā)布進(jìn)一步延續(xù)了這股熱潮,甚至是讓火燒的更旺了。
為了不讓微軟或者是OpenAI在該領(lǐng)域一騎絕塵,也為了自己能夠在AIGC方面得到更大份額的蛋糕。目前,全球科技巨頭都在抓緊時間追趕GPT-4。
為了提升旗下類ChatGPT模型的優(yōu)化速度,谷歌在博文中宣布正式開放其PaLM大型語言模型API。谷歌表示,“我們看到新一輪的生成性人工智能應(yīng)用正在改變?nèi)藗兣c技術(shù)互動的方式。在谷歌,我們希望通過提供易于使用的API和工具,使所有開發(fā)人員能夠開始用生成性人工智能構(gòu)建下一代應(yīng)用程序,從而繼續(xù)使人工智能變得容易使用。”谷歌于2022年4月宣布PaLM,隨后一直在優(yōu)化。北京時間2月8日晚,谷歌正式發(fā)布類ChatGPT應(yīng)用Bard,不過由于演示中出現(xiàn)事實錯誤,谷歌因此股價大跌,一天市值蒸發(fā)近千億美元。
目前,谷歌正在全力優(yōu)化PaLM。北京時間3月7日,谷歌和柏林工業(yè)大學(xué)的團(tuán)隊重磅推出了史上最大的視覺語言模型——PaLM-E,參數(shù)量高達(dá)5620億,是GPT-3(參數(shù)量為1750億)參數(shù)規(guī)模的數(shù)倍。
除了谷歌,目前國內(nèi)科技行業(yè)都在關(guān)注百度文心一言的發(fā)布。百度將于北京時間3月16日下午兩點(diǎn)發(fā)布自己的類ChatGPT應(yīng)用文心一言。根據(jù)此前的爆料消息,文心一言是百度基于文心大模型技術(shù)推出的生成式對話產(chǎn)品,被外界譽(yù)為“中國版ChatGPT”。2021年12月,百度與鵬城實驗室聯(lián)合發(fā)布共同研發(fā)的全球首個知識增強(qiáng)千億大模型——文心,當(dāng)時百度首席技術(shù)官(CTO)王海峰表示,該模型參數(shù)規(guī)模達(dá)到2600億,是目前全球最大中文單體模型。這段時間,百度在加班加點(diǎn)地調(diào)教文心一言,可能綜合實力會比更新的ChatGPT有差距,不過在中文能力上估計會是全球獨(dú)一檔的存在。
針對國內(nèi)類ChatGPT應(yīng)用的發(fā)展,360周鴻祎表示,ChatGPT比造芯更容易,在國家鼓勵性政策的支持下,中國用兩三年就能追上美國的水平。不過,在ChatGPT訓(xùn)練必需的通用算力GPU方面,國內(nèi)和英偉達(dá)的總體差距預(yù)計在10年左右。
總結(jié)
比爾蓋茨曾表示,以ChatGPT為代表的人工智能的進(jìn)步是目前“最重要的”創(chuàng)新,重要性不亞于互聯(lián)網(wǎng)的發(fā)明。目前,全球科技迷對GPT-4趨之若鶩,國內(nèi)馬上也要有自己的“中國版ChatGPT”——文心一言,AIGC掀起的顛覆浪潮已經(jīng)一浪高過一浪了。
發(fā)布評論請先 登錄
相關(guān)推薦
評論