2024年第一季度才剛過半,AI領域就大動作不斷,大家卯著勁的出新品,可謂卷出天際。
3月4日,Anthropic發布了最新的Claude 3系列模型,用Anthropic的話說,Claude 3的出現意味著打開了一個全新的世界,其系列模型在推理,數學,編碼,多語言理解和視覺方面,都樹立了全新的行業新基準。
也正是因為Claude 3的出現,全球最強AI模型一夜易主,曾經被認為不可一世的GPT-4被拉下神壇,Claude 3很可能對GPT-4實現全方位的碾壓。
Anthropic發布3個模型,全方位實現Claude 3的超強性能。
據悉,本次Anthropic共發布了三個模型,按照性能從低到高,分別是Claude 3 Haiku,Claude 3 Sonnet,以及Claude 3 Opus,并發布了一份長達42頁的技術報告。
值得一提的是,此次3個模型的命名是很有講究的。依照功能的從低到高,它名字的翻譯分別是緋句(Haiku),代表性價比之王;十四行詩(Sonnet),代表響應較快,是性能加強版;以及巨作(Opus),堪稱性能頂配。
由此可見,Claude 3 Opus在本系列中性能最強大。該模型已在多項AI系統常用評估標準中領先業界LLM,如本科級別專業知識(MMLU),研究生級別專家推理(GPQA),基礎數學(GSM8K)等。特別需要說明的是,Claude 3 Opus在處理復雜任務時,其理解和表達能力幾乎接近于人類,這意味著人類在AI領域又邁進了一大步。
通過將Claude 3系列模型與同類產品進行對比,我們可以看到,Claude 3 Opus模型性能完全能夠碾壓GPT-4,以及Gemini 1.0 Ultra;Claude 3 Sonnet在部分基準上,諸如GSM8K,MATH等方面超越了GPT-4;Claude 3 Haiku也可以與Gemini 1.0 Pro相抗衡。
擁有三大核心優勢傍身,Claude 3前途無量。
總結Claude 3所具有的優勢,主要有以下三點:
性能無短板,擅長長文本優化,顯著降低拒絕率。
先來說說性能方面。Claude 3的大語言模型全面趕超了GPT-4,多模態視覺任務處理性能力優秀,在回答復雜開放性問題時的準確率也翻倍提升。特別是當用戶直接上傳數學,物理這一類考驗邏輯和準確度的理科題照片,或者細節豐富的圖表時,Claude 3所回復的解題水平和準確率相較于先前版本提高了很多,甚至在一些細節描述上比GPT- 4更勝一籌。在多模態能力方面,Claude 3模型可以從視覺上識別物體,能用復雜的方式思考,既能理解物體的外觀,也能理解它與數學等概念的聯系。
Anthropic AI研究工程師Emmanuel Ameisen就曬出了一個測試示例:向Opus輸入2小時13分鐘視頻原始文本,每隔5秒截取的屏幕截圖等圖文素材,它就能成功將其轉換成一篇圖文并茂的HTML格式博客文章。
在文本優化方面,Claude 3也交出了一份令人滿意的答卷。要知道,先前的Claude 2.1版本常被吐槽長文本理解效果差,Claude 3便在這個方面做了重點改進,頂配Opus在200K tokens NIAH測試中準確率超過99%,展現了強大的召回能力(1K tokens相當于750個單詞)。
此外,Claude 3還顯著減少了拒絕回答問題的頻率。很多大語言模型會頻繁拒絕回答詢問,Claude 3則顯著改進了這一點,它能夠更明確的辨別真正的風險問題,減少無故拒絕回答安全詢問的情況。
“OpenAI叛軍”完美制衡住了GPT-4,未來的AI王者將鹿死誰手?
Anthropic用一記絕殺將GPT-4拉下了神壇,很多人覺得這是AI新秀的一次勝利。但如果你了解過Anthropic與OpenAI之間潛藏的錯綜復雜關系的話,就會發現此次Claude 3的勝利,并非偶然。
Anthropic究竟是誰?有消息來源表示,Anthropic其實就是原OpenAI員工組建的公司,這些員工因為某些發展理念不合直接出走,并選擇“反叛”,最終成為了OpenAI的最強勁敵。
2021年,多名OpenAI員工不滿OpenAI在獲得微軟投資后走向封閉,憤而出走并聯合創立了Anthropic。他們對OpenAI在安全問題尚未解決的情況下就直接發布GPT-3的行為感到不滿,認為OpenAI已經為追逐利益而“遺忘了初心”。
這一干出走的員工之中就包括打造出GPT-2和GPT-3的研究部門副總裁Dario Amodei。他在2016年進入OpenAI,離開前擔任研究副總裁,這絕對是OpenAI的核心位置。離開時,Dario還帶走了GPT-3首席工程師Tom Brown,以及擔任安全與策略部門副總監的妹妹Daniela Amodei以及10多名心腹,可謂人才多多。這些人才,也最終成為了Anthropic的中流砥柱。
2023年1月,Claude開啟內測,彼時很多網友在第一時間體驗了Claude,并表示它比當時的GPT-3強太多。
除了擁有諸多人才,Anthropic如今也獲得了強大的資本為其背書,截至目前,它已經獲得了包括谷歌,亞馬遜云科技在內的26個機構或個人的融資,總計融資金額達到了76億美元。
毫無疑問的是,如今Anthropic的飛速發展和進步令更令業界十分振奮。這個僅誕生3年的大模型初創公司,不是手握頂級人才,更擁有了鈔能力和雄厚的計算資源。這說明OpenAI在大模型技術上的領先身位并非遙不可及。坐擁Top級創始成員和精兵強將的創業團隊,完全有能力做出與OpenAI風庭抗禮的產品,所消耗的人力,財力,算力資源卻只會更少。
Claude 3的橫空出世和巨大成功或許會給我們帶來一些啟發:或許,我們也是有機會和能力來做出超越GPT-4的產品的。
如果單論規模,Anthropic顯然不及OpenAI,但它依舊取得了巨大的成功。每每提起AI賽道,我們總會認為這個賽道就是要無止盡的燒錢,卷人才,卷技術。不過,相較于耗費了多大的成本去卷,怎么卷,朝哪個方向卷顯然是更重要的事情。畢竟,在AI領域,選擇永遠大于努力。
或許在不久的未來,OpenAI還會推出令人驚艷的GPT-5,但至少就目前而言,GPT不可戰勝的神話已經破滅了。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30896瀏覽量
269087 -
人工智能
+關注
關注
1791文章
47279瀏覽量
238497 -
OpenAI
+關注
關注
9文章
1089瀏覽量
6513
發布評論請先 登錄
相關推薦
評論