金融大模型,被認為AI大模型產業化落地的第一站。
金融行業有著結構化數據充沛、應用場景豐富、數字化基礎設施良好等一系列特點,這些都是融合AI技術的利好因素。所以當AI大模型開始爆火之后,各界會不約而同認為金融是AI大模型的天然良港。
從2023年至今,中國金融大模型市場的發展也確實印證了這一判斷。根據相關數據,目前中國市場已經有近20個金融大模型落地應用,頭部金融機構要么已經應用AI大模型,要么展示了對AI大模型的研發與應用計劃。
要知道,在降本增效的大背景下,金融機構目前還需要兼顧移動金融、數字系統自主替代等多項數字化投資目標,能夠分給AI大模型的資源并不豐富,而AI帶給金融機構的投資回報比還非常有限。高效上馬大模型,對金融行業來說真的值得嗎?
記得2023年我在參加一個金融科技峰會時,與一位銀行代表進行溝通。他提出金融機構做AI大模型,最根本的動力是擔憂。在移動互聯網時代來臨前,全球金融行業普遍低估了新技術帶來的沖擊力。隨后被Apple Pay、支付寶、微信等移動互聯網平臺分潤了時代紅利。不讓類似境況重演,是驅動金融機構加碼AI大模型的底層動機。
如果是這樣的話,金融行業僅僅快步走向大模型并不夠,同時還需要聽見遠方的風,要能夠從長期目標來回溯中短期的行動規劃。
今天,我們就從這個觀點出發,聊聊快速用上了大模型之后的金融行業,接下來走向何方?
金融大模型,從高速覆蓋1.0,走向價值最優2.0
從全球到中國市場,生成式AI帶來的大模型之變,都在一年多的時間里掀起了金融行業的科技革新浪潮。
在國際上,OpenAI將金融行業視為GPT技術落地的首站,比如其與摩根士丹利合作,推出了基于 GPT-4的投資顧問機器人。
而在中國金融行業,AI大模型可謂以前所未有的態勢得到了高速覆蓋。在短短一年多的時間里,處于頭部地位的銀行、券商以及保險機構紛紛完成了金融大模型的落地應用。
比如說,工商銀行就宣布建成了同業首個全棧自主可控的千億級AI大模型技術體系,并在多個金融業務領域實現了創新應用。例如在網點運營上,推出了基于大模型的網點員工智能助手。農業銀行AI推出了類ChatGPT的AI大模型應用ChatABC,并在科技問答場景進行了內部試點。郵儲銀行通過接入百度“文心一言”,從而在智能風控、智能運營、智能投研、智能營銷等場景進行大語言模型應用。
在民營銀行層面,網商銀行將大模型技術應用于產業金融層面,從而識別小微企業的信用畫像。在保險行業,眾安保險搭建了“眾有靈犀”系統,將大模型帶入智能客服、到期提醒、智能運營等業務場景中。
而從技術與解決方案供應商的層面看,目前中國市場已經呈現出多樣化的金融大模型技術供應渠道。騰訊云、螞蟻金服都推出了金融大模型解決方案。面向金融行業既需要大模型落地,同時也需要基礎設施更新的需求。華為在2023年依托盤古大模型,推出了金融級PaaS解決方案,發布了包括AI for Data、AI for Business、AI for IT三大類10個場景的金融大模型方案。
而在開源大模型層面,度小滿開源了軒轅大模型,其在1760億參數的Bloom大模型基礎上訓練而來,已經應用在度小滿各個業務場景,覆蓋了從營銷、客服、風控、辦公到研發等場景,并在一系列大模型評測中取得了領先地位。
可以看到,金融大模型已經快速走過了以高速覆蓋為特征的1.0時代。在第一階段,金融大模型相關技術與解決方案快速出爐,頭部金融機構競相試用,為中國金融大模型的發展打下了良好的基礎。
金融大模型第一階段的發現成果顯而易見,比如說,技術發展速度快,用戶積極性高。同時金融大模型的業態覆蓋非常完整,從銀行到保險、證券等領域兼顧,此外相關的技術能力供應鏈已經完善。閉源模型與開源模型兼顧,多種部署方式完備,與金融大模型相配套的軟硬件基礎設施已經較為齊全。
但在接下來,金融大模型需要從具有探索性質的1.0階段,走向必須要求回報率,要體現長期發展價值的2.0階段。
這一階段,金融大模型需要面臨的挑戰更加復雜,同時戰略方法論的問題也將浮出水面。
已經暴露出的挑戰
統觀金融大模型的落地進程,會發現其中表現出的優劣勢邏輯,與此前AI技術落地金融業如出一轍。第一階段,行業會直觀感到AI很好用。但接下來,AI能否帶來充足的投資回報,能否深入業務核心,才是更大的挑戰。
目前,金融大模型也遇到了類似問題。首當其沖,大模型所帶來的智能幻覺、數據污染等問題,與金融行業對專業性、安全性的極高需求是難以匹配的。
其次,由于金融行業極高的涉密等級與安全合規要求,往往需要私有化進行大模型部署,同時禁止模型學習大量數據,禁止數據過分流動。這又催生了兩個問題,一個是私有化部署給金融機構帶來了極大的研發與運維成本壓力。另一個是高安全等級與限制數據使用,帶來了金融大模型效果不佳等問題。
對于金融機構來說,不僅是研發、訓練大模型的成本過高,將模型進行場景化部署的成本壓力也很大。由于目前金融大模型還處在探索階段,難以帶來實際的商業回饋,因此其部署往往是在機構內部,或者邊緣業務中。這就導致部署成本不斷放大,但商業化價值卻遲遲無法釋放。
最后,也正是處于金融行業高安全,與大模型技術不夠成熟二者間的差距。金融大模型普遍無法在金融核心業務中進行部署。比如大模型加持的智能客服,不僅無法代替客服人員,還可能出現需要頻繁喚醒人工客服,且需要客服重新理解用戶需求的現象。而在風控等產業應用側,大模型雖然表現出了巨大的潛力,但還無法真正處理較為復雜的風險異常。
這種情況下,金融大模型很可能在運行一段時間,熱度相對褪去之后,又和許多金融科技一樣流于邊緣化。
如何才能突破技術與產業之間的長期壁壘?這可能需要金融大模型聽到一些來自遠方的風。
從未來,回看現在
布萊特·金在著名的《銀行4.0》中,第一章就在討論第一性原理的回歸。即我們需要回歸問題的本源,回歸設計的本質。放在金融場景,就是我們首先需要理解銀行被設計出來是為了什么,繼而在討論銀行應該如何發展。
想要打破金融大模型可能面對的壁壘,我們也必須有這樣一個意識:去思考,去判斷,甚至去假設未來大模型究竟能給金融帶來什么,再從未來倒推現在。
哪怕這個未來相對遙遠,至少遠方的風不會帶我們走進死胡同。
那么,AI大模型到底能為金融帶來什么?
這個問題可以分為兩個維度去理解,一個是技術維度,一個是應用維度。
從技術上看,大語言模型的技術升級路徑已經相對確定,業界對其技術發展范式以及工程化實踐已經有了明確的共識。
比如說,最近我們讀了由度小滿金融技術委員會執行主席、數據智能應用部總經理楊青所撰寫的《大語言模型:原理與工程實踐》。書中除了明確提出了大語言模型的多項關鍵技術之外,還指出了其在涌現能力、推理能力上的特點,以及廣受關注的大語言模型縮放定律。隨著模型訓推能力的提升,大語言模型將持續出現智能涌現效果。這一技術錨點是金融行業所追尋的長期價值,也是度小滿等金融科技供應商探索大語言模型的價值關切。
而從應用維度看,目前金融大模型的應用場景繁多,但歸根結底可以總結成三個方面:
面向大眾用戶的智能客服-智能顧問。
面向產業用戶的智能信貸識別-信用體系構建。
面向金融機構內部的職員能力提升。
這三種能力的極致化,就是金融大模型可能帶來的長期價值。比如在未來,以大語言模型驅動的智能客服,可能會變成智能顧問、一對一的金融服務專家。不僅可以完成業務對接,信息告知等基礎功能,還可以結合用戶需求給出定制化的金融方案,實現金融訂制能力從大額用戶、企業用戶向普惠用戶的轉變。
將技術維度與應用維度進行綜合,我們可以將金融大模型的未來錨定在三個方面:
1.企業與個人信用服務的智能泛在化。
2.金融客服的少人化甚至無人化。
3.金融機構綜合智能能力的極致化。
如果說,移動金融是把銀行、券商直接開到了用戶手里,是讓金融距離用戶更近,那么AI大模型金融,則是讓用戶走得更遠,讓用戶的一切訴求與資產都可以與金融服務建立聯接。
用遠方的風,丈量現在的路
一段時間以來,金融大模型領域存在著務虛與務實的爭論。
所謂務虛,是指金融機構應該更關注算法本身,關注模型性能,先上馬大模型,拿著大模型的錘子找金融業務的釘子。
而務實則是要求從金融行業的應用場景出發,優先考慮金融應用智能化的安全合規與成本可控,在此基礎上再去適配裁剪大模型的能力,讓大模型為金融服務。
某種程度上來說,二者都有正確的因素,但或許也都可以補充新的思路。因為二者都更加關注短期抉擇,忽略了金融大模型的出發點是行業的跨時代升級,是尋求像移動金融一樣,甚至更加深刻的長期變革。
金融大模型需要補充的思路,就是務實務虛之外,需要務未來,需要從最終可能實現的理想化目標,來一步步推導現在的工作。讓遠方的風,吹動現下的腳步。
從這個角度看,金融機構就需要兼顧上馬大模型的效率,同時兼顧未來可能隨時出現的更多AI技術創新。讓自身的數字化架構與軟硬件基礎設施,適配隨時會到來的AI技術迭代。具體來看,“務未來”的金融大模型,可能包含以下三層行動:
1.打好金融大模型基座。其中包括自身的研發體系,也包括與技術供應商之間開放有效的合作關系,避免因過度保守而遭遇技術擱淺。
2.兼顧金融大模型的工程力與想象力。面向大語言模型的長期發展,金融行業不能局限于有大模型,更需要錘煉對大模型的工程化掌控力,隨時可以將大模型錘煉成符合自身需求的狀態,同時積極開啟創造性的大模型探索。既在內部醞釀變革,也不放過外部機遇。
3.構建長期且清晰的智能化目標。對于金融大模型,我們要正視其短期的局限性,以及長期的可能性。在戰略上回歸大模型最本身的第一優先性原理,然后以此為目標倒推每一步的進展。
當大模型出現在金融業面前時,我們的第一感受都是驚喜與遐思。但在實際應用大模型時,往往會過于聚焦眼前,比如是否使用了大模型,覆蓋的業務場景,以及帶來的投資回報率。這時,浮現出的挑戰以及不那么清晰的價值往往會滋生矛盾,讓金融機構進退維谷。只要讓遠方的風吹進來,讓金融智能化的長期主義映照現在,絕大部分問題都會找到解法。
P.s.本文寫作過程中,《大語言模型:原理與工程實踐》帶來了許多啟發與幫助,特此感謝。
書中詳細介紹了大語言模型的工作原理,如何評估大語言模型的性能,以及大語言模型在金融場景的實際操作方案。
相信無論是計算機與AI領域的產品、技術、研發人員,還是金融行業的從業者,都能夠從中獲益。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30979瀏覽量
269249 -
大模型
+關注
關注
2文章
2474瀏覽量
2773
發布評論請先 登錄
相關推薦
評論