電子發燒友網報道(文/李彎彎)今年以來,國內外大模型可以說是蓬勃發展。國外OpenAI已經陸續推出GPT-3.5,GPT-4以及升級版GPT-4 Turbo,并且已經實現較大規模的應用。據其統計,至今已有來自全球200萬開發者正在使用OpenAI的API,92%的世界500強公司正在使用OpenAI的產品搭建服務,且ChatGPT的周活用戶數達到1億人。
此外Google、Anthropic、Cohere、Meta都在大模型上都有相應的進展。國內百度、阿里、騰訊、百川智能等也都發布了其大模型產品。據此前百度創始人、董事長兼首席執行官李彥宏表示,截至10月份,國內已經發布238個大模型。可以看到,國內外科技巨頭及AI初創企業都投入到大模型的研究中。然而當下,大模型如何實現商業化應用成了業界關注的重點。
大模型商業化路徑
大模型的商業模式基本可以分為兩類:to C和to B。to C方面,目前來說已經有幾個很好的案例,最為典型的就是OpenAI。去年11月底,OpenAI推出ChatGPT,兩個月獲得1億月活用戶,4個月后,月活用戶突破10億。巨大的用戶積累讓OpenAI有了實施to C業務的基礎,今年2月,OpenAI推出付費訂閱版ChatGPT Plus,每月收費20美元。
隨后美國涌現出一大批類似的產品,基本都是面向C端使用,訂閱付費模式。據應用商店監測平臺Sensor Tower的數據,2023年上半年AI應用下載量同比增長114%,突破3億次,超出2022年全年水平;此外,AI應用內購收入同比激增175%,逼近4億美元。
向C端收費主要是基于OpenAI的大模型建立的應用,有一個案例,也是最早在C端賺到錢的公司——Jasper。最早在2020年,OpenAI推出GPT-3,次年,Jasper成立,通過接入GPT-3模型,針對市場營銷場景做精調,自動生成各種風格的營銷文案,當年就賺了3000萬美元。
文案寫作是一個需求明確的市場,用AI生成文案,只要效果比人好,就會有人買單。Jasper的用戶中一度有超過四分之三的人每個月支付80美元甚至更多,來獲得各種寫作模板套件。它在2021年的收入超過給它提供底層技術的OpenAI。
后來,美國有非常多創業公司,調用大模型的API來打造新的應用,最火爆的是AI對話機器人和Midjourney這類AI圖像生成產品,在應用商店分別貢獻了49%、31%的下載量。據調查,這類公司一度比基礎大模型公司更賺錢。有人在今年6月統計了全球月訪問量最高的50個AIGC網站,發現名單上90%的應用有收入,幾乎所有公司都采用訂閱制。
在國內,第一個嘗試此種商業模式的是百度,百度文心一言在11月1日上線專業版,每月收費59.9元。另外還有一款應用,就是今年7月火過一陣的妙鴨相機,收費9塊9。
to B方面,一種是通過開放API接口的方式賺取收益,就如上文提到的Jasper,它接入OpenAI的GPT-3模型,需要向OpenAI支付調用API的授權費用。至今已有來自全球200萬開發者正在使用OpenAI的API,可見OpenAIto B客戶體量之大。
在國內,商湯也在走這樣的模式,今年上半年商湯發布日日新大模型,產品并沒有向C端消費者開放,它直接面向政企客戶開放API接口。
to B業務方面還有另一種方式,即SaaS模式,AI廠商借助大模型的能力,給企業做方案、改系統、跑流程,最終降本增效,從而向客戶收費。造物云創始人邱懿武此前在接收媒體采訪的時候表示,他們曾幫助一家電子煙品牌做產品設計,花了100萬找傳統設計公司做了100多個方案,現在通過AI大模型,生成800個設計方案只花了10塊錢的算力成本。
國內大模型發展現狀
從目前的情況來看,國內大模型走B端市場更多,也就是之前大家提得比較多的行業大模型。即用行業數據對通用大模型進行精調形成的行業大模型,在特定領域實現應用。國內科技大廠從基礎大模型做起,搭配行業大模型,搶占各大垂直行業,比如華為發布盤古大模型后,很快就在金融、制造、礦山、氣象等垂直領域布局了垂直大模型,形成廣泛覆蓋。
互聯網大廠也傾向于將自研的通用大模型,跟自己的云業務結合,如百度、騰訊、阿里等,在自己的云平臺上搭載多個大模型然后把模型、算力、工具打包,以AI開發平臺的形式對外提供服務。比如,百度的文心千帆大模型平臺,企業可以在平臺上選擇基座大模型,調用各種工具,在云端做推理、微調及托管,生成自己的大模型,然后定制化開發產品。這種就不是單純的調用API接口,對于客戶來說更方便好用。
當前,國內外企業在大模型方面采用兩種方式,一種是開源,一種是閉源。開源即開放源代碼,允許開發者查看、修改和分發開源代碼;閉源則與之對應,用戶只能對產品有使用的權利,沒有修改的權利。如Meta公司的ChatLLaMA就是國際上最為主流的開源大模型之一。在國內百川智能之前也推出了幾款開源的大模型,據該公司介紹,其發布的Baichuan-7B/13B兩款開源大模型累計下載量已超過600萬次。
在這種開源大模型的協助下,國內外也涌現更多大模型產品。開源本身有它的好處,它有助于技術的快速迭代與創新,形成繁榮的生態。然而太多企業沉迷于研發屬于自己的通用大模型,對于整個產業的商業化發展并不是一件特別好的事情。
近期,李彥宏就這個話題發表了觀點,在他看來,目前,國內已經發布238個大模型,大模型太多,而模型之上開發的AI原生應用太少。他認為,人類進入AI時代的標志,不是產生很多的大模型,而是產生很多的AI原生應用。大模型本身是一個基礎底座,類似操作系統,那么最終開發者要依賴為數不多的大模型來開發出各種各樣的原生應用。
“不斷地重復開發基礎大模型是對社會資源的極大浪費。”他表示,由于沒有智能涌現能力,專用大模型的價值其實非常有限。只有當模型的參數規模足夠大,訓練數據量足夠多并且能夠不斷投入,進行迭代,才能夠產生智能涌現,大模型才能具有觸類旁通的能力。大模型的產業化模式,應該是把基礎模型的通用能力和行業領域的專業知識相結合。
寫在最后
當下,探索大模型商業化應用是重點。同時可以很明顯的看到,大模型正在向邊緣端滲透,尤其是在手機上的應用,大模型技術正逐步成為手機的標配。
今年以來,多家手機廠商相繼傳出其手機端側的大模型已經跑通。本月初,vivo發布五個大模型矩陣,并于11月13日推出全球首個百億大模型在終端跑通的大模型手機;小米創始人雷軍也在近期表示,小米AI大模型最新一個13億參數大模型已經成功在手機本地跑通;今年8月份,華為鴻蒙OS 4也宣布接入大模型。
當然,要將參數動輒百億、千億級的大模型放進手機端,也存在難點,成本高、自研難、算力消耗大等,這是手機及芯片廠商需要共同探討解決的難關。
此外,大模型的持續研發帶來的安全性問題也需要引起重視。最近OpenAI的人事變動風波,就起源于領導層對大模型安全性問題考量的分歧。據稱,OpenAI兩位頂尖研究人員 Jakub Pachocki 和 Szymon Sidor開發出了名為Q-Star的模型,它能夠以前所未有的能力來解決數學問題。消息稱,該模型的演示在OpenAI內部流傳,其發展速度令一些關注人工智能安全的研究人員感到震驚。
Q-Star能夠取得這種突破,本身基于Ilya Sutskever啟動于2021年的一項重要工作:GPT-Zero。該項目研究如何使用計算機生成的數據——而不是現實世界的數據,例如從互聯網上提取的文本或圖像——來訓練新模型。GPT-Zero獲得了突破,于是OpenAI克服了高質量語料不足的障礙,一下子有了足夠多的高質量數據來訓練新模型。
Ilya對Q-Star持謹慎和警惕的態度,他擔心該項目的持續突破將帶來嚴重的危機,因此出現了最近的OpenAI人事變動風波。種種事件顯示,科技企業在積極推進大模型研發和商業化應用的同時,也需要更多的關注它的持續突破可能帶來的風險。
-
應用
+關注
關注
2文章
438瀏覽量
34160 -
AI
+關注
關注
87文章
30894瀏覽量
269085 -
大模型
+關注
關注
2文章
2450瀏覽量
2706
發布評論請先 登錄
相關推薦
評論