如今,很多媒體與AI從業者都在追問一個問題:大模型,究竟堵在哪了?
經歷了2023年的百模大戰,AI產業迎來了從“是否有大模型”到“如何用大模型”的轉換期。各個大模型平臺紛紛走向了公開應用階段,面向C端與B端提供能力繁多的大模型應用。
然而問題也隨之而來。在大模型平臺百花齊放的同時,我們也能發現平臺之間的同質化急速加劇。C端用戶很難分清不同大模型應用之間的差異化,企業用戶面臨著復雜的大模型應用成本,進而導致真正能夠實現規模化調用的大模型寥寥無幾。
在技術相對成熟之后,大模型與用戶之間,似乎還是缺少了一點磁力。
我們經常討論,沒有任何底層技術可以不經過產品化探索,不進行商業邏輯設計就獲得用戶認可。技術、產品、商業,三者之間一定是互為犄角的態勢,缺一不可。而在百模大戰的進程中,行業往往會更重視模型本身的技術發展,忽視產品化與商業設計的重要性。這種缺失與真空,也就是大模型缺乏用戶磁力的來源。
好在隨著時間推移,類似難題正在得到正視和解決。不久之前,在火山引擎2024“AI創新巡展”成都站期間,火山引擎宣布豆包大模型日均Tokens使用量已突破5000億,平均每家企業用戶日均Tokens使用量較5月15日模型發布時期增長了22倍。
豆包大模型的高增長,或許正是給大模型的用戶磁力難題,寫下了一張答卷。
被廣泛討論的大模型的商業難,落地難,究竟來源于何處?
從軟件技術走向應用的時間邏輯上看。基礎軟件技術迭代之后,往往需要較長的產品化周期,進而其中優秀的產品最終走向商業化。但大模型風潮與以往不同,其技術特征中本身就有極強的應用色彩。這導致AIGC類平臺與應用的爆發,基本沒有經歷任何的產品化周期,而是直接從算法革新走向了商用落地。
這種特殊的發展方式,讓大模型短期內走到了“兩多一快”的境地:市場上的大模型應用多,單一大模型應用提供的AIGC能力多,從技術走向商用的時間快。于是,用戶還沒來得及了解,眼前就被擺滿了花樣繁多的大模型應用;企業用戶還沒有準備好大模型的應用場景與商業邏輯,就被智能化熱潮裹挾其中。
大模型帶來的全新應用可能性,原本應該與用戶形成極強的磁力,但大模型的同質化,與用戶的沒有準備好之間,反而形成了一種“消磁”效應。具體來看,我們可以將其拆解為三個問題:
1.C端消磁。產品體驗感的缺失,以及技術的雷同化,讓用戶難以體會到大模型的魅力所在,進而在嘗鮮期過后,快速出現了對大模型應用的擱置。
2.B端消磁。過高的嘗試成本,讓企業在還沒有準備好實用大模型的時候,就需要付出較大的模型部署成本,從而導致大量企業傾向對大模型進行觀望。
3.行業消磁。快速成型的大模型體系,更多提供的是通用性較強的能力。然而眾多行業需要的是專業化、定制化的AI功能,不能充分了解行業需求,導致大模型能力浮于行業表面,無法深入其中。
2023年8月,字節旗下的首款類GPT應用豆包正式發布,很快攻陷各大應用市場。目前豆包底層的大模型已經應用于字節內部各大業務,覆蓋了協同辦公、數據分析、文案創作、輔助編程、內容審核等場景。當這個大模型最終以“豆包大模型”的名稱正式發布走向市場,所需面對的最大挑戰就是如何建立AI與用戶之間的磁力,打通大模型的商業化落地空間。
此后的近一年時間里,我們能看到豆包帶來了關于大模型磁力的三重奏。
經歷了快速的技術迭代與產品梳理,如今“豆包”的定義更加明確和統一。它表面是一款類GPT的應用,背后實際是一整個豆包模型家族,而與底層大模型同名的豆包APP,則是字節通過模型升級產品體驗,與C端用戶重新建立磁力的通道。
為了破解大模型應用缺乏魅力,產品同質化太高的問題,豆包貫徹了一個核心產品設計原則,擬人化。
從AI命題被提出的那一刻,這種技術的核心就是讓機器模仿人。而伴隨著無數科幻作品的熏陶,大眾對AI魅力的認知與期待也都在于擬人。但要注意的是,AI擬人的目標并不能僅僅依靠技術手段來實現。而是需要產品層面的更多雕琢。
為了實現豆包的擬人化,相關團隊在多個層級進行了一系列產品設計。比如說,依靠豆包家族里的語音識別模型和聲音復刻模型,進而實現與其對話貼近與真人對話的感覺。
在進入豆包聊天界面后,用戶會感覺到與社交軟件非常相似的產品設計。比如說,聊天框頂部有對話頭像,這一點繼承了用戶與真人聊天的產品習慣。
在豆包大模型家族中,還推出了角色扮演模型。這個模型當中,AI會模仿不同人設、不同性格的人來與用戶進行對話,并且可以通過智能體來自行設定聊天角色。將擬人化作為核心功能之一,可以快速拉近與用戶的距離,消弭掉用戶對AI技術的陌生感。
具體到AIGC能力當中,豆包同樣強調擬人化思路的貫徹。比如豆包在進行PPT制作功能時,在PPT生成之外還會提出制作PPT所需注意的問題。這就非常類似于朋友或同事進行合作時的情況,而不僅僅是簡單的AI工具。
在擬人化核心特性的加持下,豆包很快得到了用戶群,尤其是年輕用戶的認可。隨后,豆包的戰略權重開始不斷上升。形成了具有多模態能力的模型家族,包含了通用模型pro、通用模型lite、語音識別模型、語音合成模型、文生圖模型等十款模型。
豆包雖然是AI模型,但其差異化恰好在于對“人”的重視。通過精細的擬人化產品設計,其完成了對大模型同質化問題的擺脫。
而在產業端,豆包也將這種直面問題核心的思路貫徹了下去。
面對大模型機遇,各行業以及無數AI開發者都躍躍欲試。但較高的模型使用成本,依舊會給企業進行大模型探索、試錯造成一定的影響。尤其伴隨業務的不斷發展,大模型成本也會不斷上升。在真正推動大模型落地前,成本賬是企業用戶必須先算清楚的。
與此同時,大模型的開發方面臨著另一重困境。模型的調用量不足,開發者生態無法成型,直接導致大模型無法根據反饋進行優化調整,單位模型的推理成本也居高不下。因此,只有用起來才是大模型的唯一出路。對于大模型本身和企業用戶而言,中間的成本門檻已經成為雙方共同的困擾。
在這樣的態勢下,豆包率先進行了大模型低成本化的商業思路。豆包大模型目前通過字節跳動旗下云服務平臺火山引擎面向企業開放,5月15日,豆包大模型正式發布之時,火山引擎宣布豆包主力模型在企業市場的定價已經達到了0.0008元/千Tokens,0.8厘就能處理1500多個漢字。這個價格已經降低到了此前行業通行方案的1%還低。
豆包率先推動大模型進入“厘時代”,為企業降低智能化成本帶來了巨大的影響。整個行業開始跟隨和效仿,企業以更低成本、更便捷方式接入大模型成為新的主流。
尤其值得注意的是,與行業內流行輕量化版本降價,吸引企業用戶試用,然后主力模型保持較高價格的思路不同。豆包將主力模型與輕量化模型都進行了大幅價格優化,主力模型給出了低于行業價格99%的定價。為企業用戶與大模型之間的深度結合,掃清了最后的障礙。
除了大眾用戶與企業用戶之外,大模型落地的很大一部分動力,來自全行業模式的驅動。大模型可以伴隨著行業頭部用戶的使用,快速在行業軌道中進行復制和推廣,從而深度加強行業智能化水平。
在這個過程中,大模型了解行業,深入行業成為最主要的挑戰。而想要解決它,也只有真正走進行業,與行業達成生態合作這一條通道。
不久之前,火山引擎聯合中國電動汽車百人會,與吉利汽車、長城汽車、捷途汽車、賽力斯、智己汽車等20余家廠商,宣布成立汽車大模型生態聯盟,致力于為消費者帶來汽車全場景AI新體驗。
通過生態合作,火山引擎可以獲得更加清晰的汽車行業智能化訴求,從而讓豆包給出更有針對性與專業性的落地方案。比如說,當前車企愈發重視用戶反饋,但伴隨網絡信息量的爆炸,人工收集網絡反饋的方式低效且不夠全面。豆包大模型可以幫助車企進行反饋信息收集,并且進行初步分析總結,從而實現智能化的信息篩選與分類,提取出車主的主要關注點與情感傾向。
此外,豆包可以在汽車行業的多個角度、多個場景實現落地。比如搭載了豆包lite大模型后,車企可以在低延遲情況下為用戶提供清晰、智能的AI對話能力,支持閑聊、搜索、娛樂、導航、車控等多個座艙智能助手場景,效果要比傳統語音處理高達50%以上。在智能座艙、智能駕駛場景中,AI對話將成為十分重要的交互手段。豆包與汽車行業的深度融合,解決了車內語音交互的系列痛點。
類似豆包與汽車的結合,火山引擎還與OPPO、vivo、榮耀、小米、三星、華碩成立了智能終端大模型聯盟。OPPO小布助手、榮耀智慧辦公智能助手、小米“小愛同學”,以及華碩筆記本電腦的豆叮AI助手等應用,均已接入火山引擎的大模型服務。
可以看到,擬人化、低成本、重生態,已經成為豆包大模型的三個支點。它們在技術之上,為豆包大模型提供了產品、商業與產業合作層面的競爭力,消解了大模型同質化帶來的落地難題。
用對用戶的尊重,對問題的正視,來重構大模型的磁力。這或許才是日均Tokens使用量破5000億背后,豆包身上值得被提取出來的“營養物質”。
-
AI
+關注
關注
87文章
31294瀏覽量
269655 -
大模型
+關注
關注
2文章
2514瀏覽量
2932
發布評論請先 登錄
相關推薦
評論