OpenAI o1大模型震撼發布,號稱秒殺GPT-4o、claude-3.5-sonnet、llama3.1-405b、deepseekv2.5、Qwen2?還超越了人類專家?
9月13日午夜(北京時間),OpenAI正式公開一系列全新AI大模型,這些模型旨在專門攻克各類難題。它們具備強大的復雜推理能力,作為通用模型,其所能解決問題的難度遠超前代的科學、代碼和數學模型。
o1便是此前OpenAI從山姆?奧特曼到各位科學家們一直大力“高調宣傳”的草莓大模型。據了解,它具備真正意義上的通用推理能力。在一系列高難度的基準測試中,o1大模型展現出了令人驚嘆的超強實力,相較于GPT-4o實現了巨大的跨越,使大模型的水平從不盡人意直接躍升至優秀級別。它無需專門訓練就能在數學奧賽中斬獲金牌,甚至在博士級別的科學問答環節中超越了人類專家。
不過,由于o1等大型語言模型是基于大量文本數據集進行預訓練的,盡管它們蘊含了廣泛的世界知識,但在實際應用中,可能存在成本高昂且運行速度較慢的問題。
因此,更多的企業或許會優先選擇開源模型。
說到開源模型,大家在評估開源模型使用效果時,通常會使用哪些站點呢?
在此,我推薦我正在使用的兩個平臺:www.perfxcloud.cn和llmworld.net,PerfXCloud可以免費評估各類主流大模型,包括llama3.1-405b、deepseek,面壁小鋼炮等各類主流大模型,llmworld上還有一些非常實用的AI小應用。
目前,o1-preview每位用戶每周僅能發送30條消息,o1-mini每位用戶每周僅能發送50條消息,我們都在期待正式上線后的價格公布。在llmworld.net上暫時還沒有看到該模型的價格信息。
在人工智能飛速發展的當下,OpenAI的o1大模型無疑為我們帶來了新的思考和挑戰。一方面,我們驚嘆于其強大的性能表現,另一方面也不得不面對其在實際應用中的局限性。
期待有更多優秀的開源模型崛起,為我們提供更多的選擇和可能性!
審核編輯 黃宇
-
GPT
+關注
關注
0文章
354瀏覽量
15372 -
OpenAI
+關注
關注
9文章
1087瀏覽量
6509 -
大模型
+關注
關注
2文章
2448瀏覽量
2701
發布評論請先 登錄
相關推薦
評論