電子發燒友網報道(文/梁浩斌)大模型廠商徹底瘋狂!電商618大促剛剛開始,大模型廠商就開始輪番瘋狂降價。每千Tokens的價格,從過去幾分錢,再下降一個數量級至幾厘,甚至還有直接開放大模型全面免費試用。
大模型進入免費時代
5月21日,阿里云宣布通義千問4款商業化模型和5款開源模型大降價,其中GPT-4級別的主力模型Qwen-Long價格直降97%,從此前API輸入0.02元/千Tokens,降價至0.0005元/千Tokens;API輸出從0.02元/千Tokens,也降了90%到0.002元/千Tokens。
Token在自然語言處理中是指文本被分割成的最小單元或標記,通常1個中文詞語、英文單詞、數字、符號計為 1 個Token,由于不同模型采用的分詞器不同,同一段文字可能分成不同數量的Tokens,比如在某個模型中,“使用者”被分為一個Tokens,但“大模型”就被分為“大”和“模型”兩個Tokens。粗略估算,1Tokens可以理解為相當于1.5個中文漢字。
然而就在上午通義千問降價之后,下午百度言簡意賅,在公眾號上發文宣布:文心大模型兩大主力模型全面免費,立即生效!
這次免費的兩大主力模型分別是ERNIE Speed和ERNIE Lite,上下文長度均支持8K、128K,均為輕量級大模型。其中ERNIE Speed適用于自然語言處理任務中的多種場景,如文本分類、命名實體識別、語義匹配等,在智能客服、搜索引擎、智能推薦等領域的應用表現突出,在閱讀理解、close-book問答、創作與續寫等復雜任務上,也能達到甚至超越千億大模型的效果。
而ERNIE Lite則適合搭載在低算力的AI加速卡上處理推理任務,應用于檢索、推薦、意圖識別等高并發、低延時等場景。
在文心大模型之后,5月22日,科大訊飛也宣布旗下訊飛星火Lite API永久免費開放,此前該模型版本價格為0.018元/千Tokens。Spark Lite同樣是輕量級大語言模型,支持在線聯網搜索功能,適用于低算力推理與模型精調等定制化場景。
除了輕量級大模型之外,在頂配的Spark 3.5 Max版本上,價格也降到0.21-0.3元/萬Tokens,即0.021-0.03元/千Tokens,這個價格相比文心一言和通義千問同級別大模型也要更低。比如文心一言的ERNIE-4.0輸入、輸出均為0.12元/千Tokens;通義千問Qwen-Max輸入0.04元/千Tokens,輸出0.12元/千Tokens。
這一輪大模型降價,可以追溯到5月初。幻方量化旗下深度求索(DeepSeek)在5月6日正式開源第二代MoE模型DeepSeek-V2,而其API的定價為輸入1元/百萬Tokens,輸出2元/百萬Tokens,算下來大概是0.001-0.002元/千Tokens,價格幾乎是GPT-4-Turbo的百分之一。
5月11日,智譜大模型官宣降價,其中個人版 GLM-3Turbo模型產品的API調用價格從0.005元/千Tokens,降至0.001元/千Tokens;最頂配的GLM-4和GLM-4V價格也來到0.1元/千Tokens。
字節跳動旗下的云服務平臺火山引擎,在5月15日推出了豆包大模型家族,其中豆包主力模型的推理輸入定價僅為0.0008元/千Tokens,當時火山引擎表示,這個價格要比行業便宜99.3%。
但大模型內卷的趨勢,并不是“中國特色”,5月13日,OpenAI推出了新一代的大模型GPT-4o,除了性能上的大幅提升之外,更重磅的消息是該新模型將全部功能免費使用。
此前OpenAI僅免費開放GPT-3.5供用戶使用,而GPT-4是要付費使用的。但在GPT-4o發布后,不僅性能上超越GPT-4,而且還免注冊開放使用。當然,免費用戶使用GPT-4o只能每三小時使用十次,超過10次將自動降級至GPT-3.5。
與此同時,商業用戶方面,GPT-4o的API調用價格也相比GPT-4 Turbo全面下降50%。
所以,大模型的全面降價,甚至是免費,已經成為目前全球AI行業的趨勢。
價格戰是“良藥”還是“雙輸”?
在互聯網行業,瘋狂燒錢的零和博弈打法已經司空見慣,從電商到外賣、再到共享單車,在行業發展初期都依靠低價打開市場規模。
零一萬物創始人兼CEO李開復認為,大模型降價對整個行業來說是好消息,行業每年降低10倍推理成本是可以期待的,而且也應該是必然發生的,但同時他也表示價格戰是一個“雙輸”的打法,大模型公司不會這樣不理智。
“當其團隊認定自己的技術值得的時候,就會堅持一個合適的價格,而絕不會靠貼錢、賠錢去做生意?!?br />
AI大模型的商業化,一直以來都是行業的頭號難題。首先是大模型訓練成本居高不下,比如李飛飛團隊分析報告顯示,Google此前發布的Gemini Ultra訓練成本高達近2億美元,OpenAI 的 GPT-4訓練成本也預計高達7800萬美元,并且隨著時間的推移,新推出的大模型訓練成本還在不斷提高。
而在C端應用中,用戶留存和活躍度也正在面臨很大挑戰,即使是ChatGPT, 自從去年六月開始流量就開始出現下降,大多數用戶使用ChatGPT還是基于嘗鮮的性質,而無法成為一個日常應用。
根據QuestMobile的數據,AICG的運營數據活躍率均在20%以下,3日留存均在50%以下,卸載率更是在50%以上。
所以,這也反映出目前類ChatGPT的大模型應用,并不是目前大模型的最終表現形式。
而面向B端的API降價,則能夠推動AI應用的開發。近一年里,大模型的技術能力提升速度極快,尤其是國內的眾多玩家入局后,大模型的能力突飛猛進。
5月21日李開復公布了零一萬物團隊在國際測評榜單中的新成績, Yi-Large在 LMSYS 盲測競技場總榜排名世界第七,中國大模型中第一;其中在中文分榜中與GPT-4o并列世界第一。
他也表示在近一年時間里,中美大模型的差距從7到10年,已經縮短到6個月左右。
因此,在當前大模型技術發展迅速的時間節點,在投入大量資本去創造大模型的同時,如何讓大模型商業落地是整個行業共同希望解決的難題。畢竟只有將大模型商業化變現,才能回收訓練支出的高昂成本。
所以大模型降價,一定程度上能夠吸引更多的企業嘗試使用大模型開發AI應用,通過AI應用去創造更廣泛的使用場景,以實現“AI普及”。
當然,大模型降價也不是盲目的?;鹕揭嬖诎l布會上表示,其在技術上有很多優化手段可以降低大模型訓練成本,而在工程上可通過分布式推理的形式提高算力利用率等。
另一方面,大模型價格戰,對于背靠互聯網業務的大廠來說,由于資金壓力較小,在市場推廣上更有優勢。但對于一些大模型初創公司,市場的價格戰毫無疑問是加速了優勝劣汰的節奏。
小結:
對于當前商業模式還未走通的大模型行業來說,嘗試總是好事。但重走互聯網時代的“零和博弈”路線,到底能否復現過去的成功,還要看后續的發展。
-
AI
+關注
關注
87文章
30887瀏覽量
269065 -
大模型
+關注
關注
2文章
2448瀏覽量
2701
發布評論請先 登錄
相關推薦
評論