文心一言 | 機器學習 | ChatGPT
隨著科技的不斷發展,人工智能技術已經成為了當今社會的熱門話題。人工智能技術的應用范圍越來越廣泛,不僅在工業、醫療、金融等領域得到了廣泛應用,而且在人們的日常生活中也越來越常見。在這個人工智能時代,人們對于人工智能技術的發展和應用也越來越關注。而在這個時代,AIGC成為了人工智能時代的新引擎。
AIGC即AI Generated Content,是指利用人工智能技術來生成內容,AIGC也被認為是繼UGC、PGC之后的新型內容生產方式,AI繪畫、AI寫作等都屬于AIGC的分支。AIGC的投資領域主要包括人工智能、機器學習、自然語言處理、計算機視覺等領域。這些領域都是人工智能技術的核心領域,也是未來人工智能技術發展的重要方向。在這些領域,AIGC已經投資了多家創新企業,并且取得了不俗的成績。這些企業涉及的領域包括智能制造、智能醫療、智能金融、智能交通等,都是人工智能技術應用的典型案例。
AIGC的投資理念是“投資未來,引領變革”。這個理念體現了AIGC對于人工智能技術的信心和追求。在AIGC看來,人工智能技術是未來的引擎,可以推動社會的進步和發展。而AIGC作為人工智能領域的投資機構,希望通過投資和支持創新企業,引領人工智能技術的變革和發展。
在人工智能時代,AIGC成為了人工智能技術的新引擎。通過投資和支持創新企業,AIGC推動了人工智能技術的發展和應用,為人工智能時代的到來做出了貢獻。未來,AIGC將繼續堅持“投資未來,引領變革”的理念,為人工智能技術的發展和應用不斷注入新的動力。本文將從AIGC的角度,探討人工智能時代的新引擎。
從上網到上算
由網絡世界至虛擬現實
隨著服務器和網絡的發展,人人都可以“上網”,而算力和算法的進步將開啟人人“上算”的時代。人工智能將以場景、應用和內容來創造用戶的新需求,而元宇宙則將包含現實物理世界,成就真正的虛擬現實。在這個背景下,我們建立了一個研究框架,其中包含四層嵌套關系。首先,人工智能和虛擬現實都屬于技術層面。其次,人形機器人/腦機接口和元宇宙分別代表了智能最終實現的兩種技術路徑——混合平臺和重構時空。人形機器人和腦機接口是混合平臺這一路徑上的不同工程方案,以機器和人為載體去構建混合平臺。第三,相較于人形機器人和腦機接口,元宇宙是智能真正實現的內在部分。最后,元宇宙的建設過程是上半場,而囊括現實物理世界的過程則是下半場,最終實現虛擬現實。
AIGC將成為Web3.0/元宇宙時代的內容供給范式之一。目前ChatGPT、AI繪畫均為AIGC的應用范疇。隨著Web3.0/元宇宙時代內容的快速增長,依靠PGC/UGC的供給有限,低成本高效率的AIGC將成為重要的內容供給方式之一。當前ChatGPT、AI繪畫的突出表現打開了人們對于AI生成式內容的想象空間,我們推演,AIGC的終極是以內核為AI,依場景需求借助一定的硬件形態呈現出來的垂類硬件,如特斯拉推出的人形機器人等。AIGC或將掀起新一輪產業浪潮,沖擊原有競爭格局與商業模式。
AIGC具有廣泛的應用場景,以ChatGPT為代表,其在代碼生成、糾正語法生成文本等方面表現出極強的能力,并憑借“對話式”搜索的強交互模式對現有的搜索引擎造成了較強的沖擊,并影響了現有戰略布局。谷歌內部拉響了紅色警報,微軟將ChatGPT整合入Bing搜索,擬重塑現有業務體系。在此基礎上,ChatGPT試點訂閱制付費模式,將打破原有競價搜索廣告的商業模式,具有巨大的商業化潛力,同時也為AI行業的商業化路徑做出了更多模式的探索。
生成式 AI 商業化應用新篇章
一、AIGC 成本大幅下降,人工智能商業化進程拐點已現
我們認為以 ChatGPT 為代表的 AIGC 興起,在內容創作成本、創作效率、模型計算消耗、用戶流量基礎等維度實現了重大突破,有望推動 AI 商業化進程的大幅加速。
1、AI 內容創作成本大幅降低且耗時更短,相較傳統方式優勢顯著
目前 OpenAI 定價最高的文字模型達芬奇(基于 GPT-3)為每 750 詞約 0.02 美元(折合約 0.14 元人民幣),相較傳統方式優勢顯著。在圖像生成領域,Open AI 透露其 DALL-E2 模型的圖片智能編輯及生成服務的價格,超過免費額度數量的圖片收費為每 460 張圖片 15 美元,折合每張圖片約 0.22 元人民幣。AIGC 繪畫創作平均耗時已達到分秒級,創作效率較人工優勢明顯。
2、AIGC 模型算力消耗快速下降,落地門檻降低有望驅動消費級應用出現
借助最新的 Colossal-AI 通用深度學習系統,AIGC 領域的 Stable Diffusion 模型訓練過程中可最高節省約 5.6 倍的顯存需求(從 64.5GB 大幅降低到 11.6GB),未來有望采用消費級 GTX 3060 顯卡實現模型運算功能,大幅降低 AI 商業化應用的落地門檻。
3、爆款應用快速積累用戶流量,商業化條件已基本具備
ChatGPT 發布后日活用戶數量快速突破千萬,使用者數量的爆炸式成長即反應出用戶的嘗試使用意愿強烈,未來嵌入到微軟的業務生態中也有望提升用戶的工作效率,優化使用體驗,創造更大的商業價值。
4、國內外公司持續探索商業化路徑,AIGC 生態有望加速形成
近日,OpenAI 推出 ChatGPT 付費訂閱版 ChatGPT Plus,每月收費 20 美元,而包含 Synthesia、Jasper、runway 等 AIGC 初創公司相繼推出細分領域的收費服務,未來 AIGC 產業生態有望加速構建,并形成更加清晰的 AI 商業化應用路徑。
Jasper 文本寫作功能收費模式
二、應用場景豐富,AI 商業化空間前景廣闊,建議關注三條投資主線
AIGC正在推動人工智能商業化進程的加速,這有望打開千億市場。根據德勤的數據顯示,到2021年,中國的人工智能市場規模已經達到了2058億元,預計到2025年,這個市場規模將會達到5460億元,年復合增長率約為27.63%。
中國人工智能市場規模及增速(單位:億元)
根據德勤的預測,全球人工智能產業規模預計將從2017年的6900億美元增長至2025年的6.4萬億美元,復合增長率達到32.10%。這一預測得益于移動互聯網時代帶來的海量數據、模型和算力的不斷迭代,以及各類應用場景中的商業化嘗試,這些因素為人工智能的商業化奠定了堅實的基礎。未來,人工智能產業動能有望加速釋放,從而推動人工智能產業的快速發展。
全球人工智能產業規模發展趨勢(單位:億美元)
根據《20220-2023 中國人工智能計算力發展評估報告》,人工智能商業化進程有望加速,未來隨著自然語言處理、計算機視覺、AIGC 等細分技術的持續迭代,AI 應用將呈現場景應用深度和廣度并行發展態勢。特別是以 AIGC 為代表的生成式 AI 將在創作型工作(文本、圖像視頻創作)和預測、決策型工作中扮演更加重要角色。
人工智能應用場景發展
三、AIGC 應用有望從 B 端延伸至 C 端市場,空間廣闊規模超兩千億
根據Gartner《2021年預測:人工智能對人類和社會的影響》,到2025年AIGC產生的數據將占所有數據的10%。因此,我們對標海外AIGC廠商,如Jasper.AI、Stability.AI等公司的商業模式,測算國內2023年、2025年和2030年AIGC市場空間,發現市場空間超過兩千億。預計到2025年國內AIGC市場空間可達403.52億元,到2030年市場空間可達2175.58億元,未來幾年市場有望迎來爆發式成長。
在AIGC領域,文字、圖片滲透率有望快速提升,但視頻、直播等受限于技術迭代滲透率較慢。目前AI在文本和圖像生成領域技術已相對成熟,同時微軟、百度等科技大廠有望將AI技術應用到業務生態中,有望推動在線辦公、搜索引擎等應用場景的滲透率提升。然而,在直播、影視以及音視頻等領域,由于AI生成技術處于初級階段,且下游用戶對內容要求較高,我們認為短期內滲透率提升幅度較低。
AIGC 國內理論市場空間測算
四、ChatGPT 面世即成頂流,性能持續提升商業化價值不斷放大
OpenAI 在 2022 年 11 月 30 日發布了 ChatGPT,這是一款對話式 AI 新模型,能夠進行人機交互的問題回答、文本寫作以及代碼編寫等功能。該模型使用了 Transformer 神經網絡架構,并通過維基百科以及大量真實語料庫的數據訓練,實現了接近人類的交流水平。ChatGPT 的出現標志著生成式 AI 領域的突破性進展,也讓 ChatGPT 成為了一個備受關注的話題。
ChatGPT 實現交互問答
ChatGPT是一種具備自我學習能力的人工智能模型,自面世以來,其性能不斷得到提升。在2023年1月30日,OpenAI官方宣布,ChatGPT通過新一輪的更新,其準確性和真實性得到了顯著提升,并且已經具備了比較基礎的數學計算能力。經過使用者的測試,目前ChatGPT的數學計算能力接近小學生水平,雖然相較其代碼和文本寫作相比差距甚遠,但進步非常明顯。ChatGPT在數學領域的計算能力逐漸形成,反映出模型的自我學習能力以及模型遷移能力出色。
ChatGPT 日活用戶數爆發式增長
微軟計劃推出一系列基于人工智能技術的應用服務,其中ChatGPT有望在實際應用中持續成長。據悉,OpenAI公司于2023年2月2日宣布推出付費試點訂閱計劃ChatGPT Plus,每月定價為20美元。該付費版功能包括高峰時段免排隊、快速響應以及優先獲得新功能和改進等。同時,OpenAI方面仍將提供對ChatGPT的免費訪問權限。
此外,微軟還推出了集成ChatGPT的全新Bing搜索服務和集成AI輔助的Edge瀏覽器。新版Bing帶有一個擴展的聊天框,它現在不僅可以回答事實問題和為用戶提供各種鏈接,還可以在ChatGPT的幫助下為用戶即時生成各種個性化的規劃、建議、分析等,解決更復雜的搜索問題。
微軟新版搜索引擎可根據問題內容提供完整解答及方案建議
五、ChatGPT 以 GPT+RLHF 模型為核心支撐,為 AIGC 發展指明方向
ChatGPT結合海量訓練數據和Transformer框架,通過RLHF模型提升交互聊天能力,實現了對自然語言的深度建模。Transformer架構為自然語言理解領域帶來顛覆性變革,應用到NLP、CV、生物、化學等多領域。谷歌在2017年提出了完全基于Self-Attention機制的Transformer架構,取得了機器翻譯任務上的顛覆性進步。Transformer由編碼器和解碼器組成,各自由若干個編碼/解碼模塊堆疊而成,每個模塊包含Multi-Head Attention層、全連接層等功能不同的工作層。相比于之前的框架,Transformer架構除了在計算的時間復雜度更優外,還有3大優勢:
1、可直接計算點乘結果,并行度高:對于數據序列 x1,x2……xn ,self-attention 可 以直接計算任意兩節點的點乘結果,而 RNN 必須按照順序從 x1 計算到 xn。
2、一步計算,解決長時依賴問題:處理序列信息使,通常用要經過的路徑長度衡量 性能,CNN 需要增加卷積層數來擴大視野,RNN 只能逐個進行計算,而 self-attention 只需 要一步矩陣計算就可以,更好地解決長時依賴問題。
3、模型更可解釋:self-attention 模型更可解釋,attention 結果的分布可反映該模型 學習到了一些語法和語義信息。
Transformer 核心框架
RHFL模型是一種預訓練語言模型,通過人類反饋進一步微調以符合人類偏好,從而直接優化模型。Open AI采用了RHFL作為ChatGPT的核心訓練方式,稱其為“能有效提升通用人工智能系統與人類意圖對齊的技術”。RHFL的訓練包括三個核心步驟:首先進行預訓練語言模型,然后對模型根據提示生成的文本進行質量標注,由人工標注者按偏好從最佳到最差進行排名,利用標注文本訓練獎勵模型,從而學習到了人類對于模型根據給定提示生成的文本序列的偏好性。最后,使用強化學習進行微調,確保模型輸出合理連貫的文本片段,并且基于獎勵模型對模型輸出的評估分數提升文本的生成質量。
RHFL 模型核心框架
推理-知識-學習-創造
AIGC重塑人工智能未來
一、復盤三次人工智能浪潮,AI 從科研向細分產業生態加速滲透
人工智能技術的發展可以被分為三次浪潮,每次浪潮都有其獨特的特點和發展趨勢。隨著AIGC的崛起,我們有望迎來第四次人工智能浪潮。
第一次浪潮主要集中在20世紀50年代至70年代,其核心是推理能力的形成。在這個時期,人工智能技術主要依靠符號邏輯和規則系統來實現推理和決策。然而,這種方法的局限性在于它需要大量的手動編程和規則制定,難以應對復雜的現實問題。
第二次浪潮主要發生在20世紀80年代至90年代,其核心是知識儲備的建立。在這個時期,人工智能技術開始利用專家系統和知識圖譜等方法來構建知識庫,以便更好地處理復雜的問題。然而,這種方法的局限性在于它需要大量的人工干預和知識輸入,難以應對大規模的數據和變化。
第三次浪潮主要發生在21世紀初至今,其核心是自我學習能力的提升。在這個時期,人工智能技術開始利用機器學習和深度學習等方法來實現自我學習和優化,以便更好地處理大規模的數據和復雜的問題。然而,這種方法的局限性在于它需要大量的數據和計算資源,難以應對數據隱私和安全等問題。
未來,我們有望進入到自我創造的階段,即第四次人工智能浪潮。在這個階段,人工智能技術將能夠自主地生成新的知識和創造性的解決方案,從而實現真正的智能化。AIGC作為一家領先的人工智能公司,有望引領這一浪潮的發展,并為人類帶來更多的創新和進步。
歷次人工智能浪潮及代表性成就梳理
1、第一次 AI 浪潮,對人類神經元機制的模擬實現機器推理能力
計算機的誕生催生了學術界對人工智能的大規模探索,第一次 AI 浪潮來襲。1946 年第一代電子計算機誕生,這一階段馮·諾依曼結構為現代計算機的體系架構奠定了基礎,而圖靈機的思想則論證了現代計算機的計算模式和計算能力,開啟了人類在現代人工智能領域不斷探索的旅程。馮·諾依曼模擬了人類大腦記憶存儲與提取的工作機制,為計算機和人工智能奠定了堅實基礎。
上世紀 40 年代,馮·諾依曼提出了計算機的邏輯結構,其主要特點包括程序以二進制代碼存放在存儲器中、所有指令由操作碼和地址碼組成、指令在存儲過程中按照執行順序進行存儲等。馮·諾依曼結構將人類的神經系統與計算機結合在一起,大幅提升了計算機的運算效率,為人工智能的發展提供了保障。
馮·諾依曼結構模擬人類記憶存儲的模式
Rosenblatts受生物神經網絡啟發,提出了一種人工神經網絡結構,這成為了現代神經網絡和深度學習的重要基礎。感知機的工作原理可以理解為生物神經網絡中的信號作用。信號經過樹突傳遞到細胞核的過程中,信號會發生變化。感知機模型在模型的“輸入”位置添加神經元節點,構成“輸入單元”。它會為每一個屬性指定一個權重w,對屬性值和權重的乘積求和,將結果值與閾值比較,從而判定正負樣本結果。然而,由于感知機模型只能解決線性問題,面對異或問題時無能為力。這也導致了第一次人工智能研究在上世紀70年代進入低潮期。
Rosenblatt 感知機模型
2、第二次 AI 浪潮,人工智能擁有知識儲備,專家系統為代表性產物
在20世紀80年代,第二次人工智能浪潮到來,其核心發展為讓計算機學習大量專業知識。研究人員將專家的知識、言論以及經驗等數據輸入到計算機,使其成為專家系統。專家系統可以預測在一定條件下某種解的概率。由于當時計算機已有巨大容量,專家系統有可能從數據中得出規律。
在這一階段,多層感知機、反向傳播算法、神經網絡的出現極大程度地提升了計算機的計算及邏輯推理能力,為深度學習和強化學習模型奠定了重要基礎。同時,專家系統的出現賦予了人工智能知識屬性,并進行了一系列的商用嘗試。多層感知機強調模擬人類腦神經的復雜連接,使人工智能實現解決非線性問題的處理能力。多層感知機可至少分成輸入層、隱藏層和輸出層這三層,隱藏層可根據需要建多層且每層都可以有多個節點,相鄰層的各個節點都互相連接。隱藏層和輸出層具備計算加權和激活函數處理的功能,實現數據信息的向前傳遞和分析。
多層感知機(MLP)模型
多層感知機的突破在于使用激活函數,它可以在隱藏層中使用不同的激活函數來對數據進行非線性化處理,從而使得計算機具備擬合任何連續函數的能力,大幅提升了計算機的計算能力。1986年,Geoffrey Hinton等人提出了多層感知機(MLP)與反向傳播(BP)訓練相結合的理念,將人類基于結果誤差反饋反哺邏輯推理的思想融入AI。BP算法的基本思想是用誤差的導數(梯度)調整,并通過誤差的梯度做反向傳播,更新模型權重,以降低學習誤差并擬合學習目標。
反向傳播(BP)模型
第二次 AI 浪潮中,專家系統模擬人類專家的知識和經驗解決特定領域的問題,實現 了人工智能從理論研究走向實際應用、從一般推理策略探討轉向運用專門知識的重大突 破。并且機器學習(特別是神經網絡)探索不同的學習策略和各種學習方法,在大量的實 際應用中也開始慢慢復蘇。
專家系統作為人工智能的重要分支,在這一時期逐步滲透到細分行業的實際場景解決 特定任務。第二次 AI 浪潮期間,專家系統應用到數學、物理、化學、醫學、地質等細分 行業,能夠輔助科研人員解決化學分子結構、疾病診斷、地質分析等特定任務。這一時期 專家系統的特點包含:(1)單學科的專業性;(2)系統結構完整,移植性好;(3)具有一 定的推理解釋功能,透明性好;(4)采用啟發式推理和不精確推理;(5)用產生式規則、 框架和語義網絡表達知識;
專家系統商業價值顯現,在企業生產決策過程中發揮重大作用。1980 年,美國卡耐基 梅隆大學與 DEC 公司合作研發的 XCON 專家系統,運用計算機系統配置的知識,依據用 戶的定貨,選出最合適的系統部件(如 CPU 型號、操作系統種類及相應型號,存儲器和外 部設備等),并且能夠給出優化意見以構成一個完整的系統。XCON 可以給出一個系統配 置的清單和這些部件裝配關系的圖,以便技術人員進行裝配。在這一時期,除 DEC 公司 外,美國杜邦、通用汽車和波音等公司在也在生產決策中借助專家系統的輔助,1986 年美 國 AI 相關軟硬件銷售額達到 4.25 億美元,人工智能技術逐漸走出科研院所,進入到企業 的實際業務場景中。
XCON 專家系統核心架構
在AI模型算法研究領域,對人類腦神經的信號處理和思考機制的模擬進一步加深,代表性產物包含了CNN、RNN等神經網絡模型。其中,1982年,John Hopfield提出了一種結合存儲系統和二元系統的神經網絡,即Hopfield網絡。這種模型保證了向局部極小的收斂,由于每個神經元的輸出均連接到其它神經元的輸入,模型能夠通過訓練從某一殘缺的信息聯想到所屬的完整信息。因此,Hopfield模型在模擬人類記憶儲存和聯想方面做出了重大貢獻,同時也勾勒了未來RNN模型的雛形。
Hopfield Network 模型
Yann LeCun提出了CNN模型,并成功驗證了其商業可行性。1989年,LeCun結合反向傳播算法和權值共享的卷積神經層發明了卷積神經網絡(Convolutional Neural Network,CNN)。CNN通常由輸入層、卷積層、池化(Pooling)層和全連接層組成。卷積層負責提取圖像中的局部特征,池化層用來大幅降低參數量級,全連接層則類似傳統神經網絡部分輸出想要的結果。CNN成功應用到美國郵局的手寫字符識別系統中,在此基礎上于1998年誕生了穩定可商業應用的CNN模型LeNet-5。
卷積神經網絡(CNN)模型
三、第三次 AI 浪潮,數據爆炸背景下,AI 進入學習時代
隨著人類進入互聯網時代,數據量呈現爆炸式成長,同時大數據技術的成熟為人工智能的發展注入了新動能。PC互聯網和移動互聯網的到來推動了人類活動數據量的快速增長,為AI模型的訓練提供了有價值的原料。同時,圍繞大數據、云計算等領域的技術迭代使得人工智能模型的計算效率、成本等方面都得到了大幅優化,為商業化應用打開了空間。
根據海外學者論文《Modeling and Simulation Strategies for Performance Evaluation of Cloud Computing Systems》,自2000年以來,全球產生的數據量呈現爆炸式增長,到2007年已接近300EB。在針對大規模數據計算領域,2003年,Google公布了3篇大數據奠基性論文,為大數據存儲及分布式處理的核心問題提供了思路:非結構化文件分布式存儲(GFS)、分布式計算(MapReduce)及結構化數據存儲(BigTable),并奠定了現代大數據技術的理論基礎。
1986-2007 年全球數據量變化趨勢(單位:EB)
Geoffrey Hinton等人提出了深度學習的概念,這掀起了第三次人工智能熱潮。深度學習的本質是使用多個隱藏層網絡結構,通過大量的向量計算,學習數據內在信息的高階表示。相較于傳統的神經網絡,深度學習模型具有更優異的特征學習能力,學習得到的特征對數據有更本質的刻畫,有利于可視化或分類。其次,深度神經網絡在訓練上的難度可以通過“逐層初始化”(layer-wise pre-training)來有效克服,因此模型精調的效率得以大大提升。
AlexNet 神經網絡模型
深度學習的出現標志著計算機實現了基于數據的學習和挖掘分析能力,AI能夠挖掘復雜信息中包含的關聯關系。2012年,AlexNet神經網絡獲得ImageNet大賽冠軍,標志著AI在圖像識別領域的突破性成就。在計算機視覺領域的競賽ImageNet中,AlexNet以提升10%的錯誤率的進步力壓第二名以SIFT+FV、LBP+FV、GIST+FV、CSIFT+FV等組合特征的算法。AlexNet基于卷積神經網絡CNN模型,在數據、算法及算力層面均有較大改進,創新地應用了Data Augmentation、ReLU、Dropout和LRN等方法,并使用GPU加速網絡訓練。之后圖像識別領域AI模型均在此基礎上進行優化,并且識別準確度超越了人類水平。
AlexNet 實現深度學習在圖像識別領域的重大突破
AlphaGo是一種具備深度學習能力的人工智能,它可以結合人類專家比賽中學到的棋譜,以及在自我對弈中進行強化學習。在2016年,AlphaGo在圍棋競技中擊敗了李世石,這標志著人工智能具備了自我迭代和學習強化的能力。AlphaGo的深度學習模型可以分為策略網絡和價值網絡,分別解決了圍棋中的“下一步最佳策略”和“下一步后的勝率”兩個問題。通過學習人類棋譜和自我對弈,AlphaGo不斷調整策略以提升棋力。AlphaGo較好地模擬了人類棋手對于圍棋落子的直覺判斷。由于圍棋存在的廣度和深度,計算機無法模擬計算所有的可能性。AlphaGo通過策略網絡減少搜索廣度,即每一步搜索少量節點,而通過價值網絡減少搜索深度,無需將棋局下到底即可得出當前局勢的判斷。
在AlphaGo的基礎上,谷歌公司推出了迭代版本AlphaGo Zero,增強了人工智能在面對人類棋譜中未出現過的局勢時的自我推理和學習能力,標志著人工智能的自我學習具備了一定的遷移能力。
AlphaGo 包含價值網絡和策略網絡兩個深度神經網絡模型
Transformer 架構橫空出世,Open AI 發布的 GPT 模型,AI 進入“大模型”時代。GPT 模型利用更大規模的文本數據以及更深層的神經網絡模型學習更豐富的文本語義表示,打破了自然語言處理各個任務之間的壁壘,使得搭建一個面向特定任務的自然語言模型不再需要非常多的任務北京,只需要根據任務的輸入和輸出形式應用預訓練模型便可達到滿意效果。
NLP 模型的搭建只需要“無監督預訓練+有監督的精調”兩階段:(1)生成式預訓練:在大規模文本數據上訓練一個高容量的語言模型,以學習更豐富的上下文信息;(2)判別式任務精調:將預訓練好的模型適配到下游任務中,并使用有標注數據學習判別式任務。
從 GPT 到 GPT-2 和 GPT-3,參數提升和訓練數據積累提升模型工作性能。到了 GPT-2 階段,Open AI 將自然語言模型定義為要完成零樣本無監督多任務學習的目標,即預訓練好的模型可以直接用于下游任務。GPT-2 模型在學習更廣泛的數據信息,增加了模型的維度參數后,不需要針對特定的任務修改模型,將任務也作為提示詞,和文本一起輸入預訓練好的模型。
承接 GPT-2 的核心思想,到了 GPT-3,模型參數量達到了 1750 億,在不進行微調的情況下可以在多個 NLP 基準上達到最先進的性能。GPT 模型的演進為國內外 AI 大廠提供了重要的借鑒意義,即通過優質訓練數據輸入和模型復雜度的增加來提升模型性能,而未來 AI 以少樣本乃至無樣本學習為核心目標。
GPT,GPT-2,GPT-3 模型對比
AI大模型在任務準確度和場景泛化性方面有顯著提升。基于此,可以提煉出針對不同實際場景的AI小模型,以完成特定任務,從而降低AI商業化部署的成本,提高訓練速度。其中,Transformer架構和GAN模型為現在的語言文本生成和圖像生成奠定了基礎。
GAN模型參考博弈學習理論,通過內部兩個模型的互相博弈,實現圖像視頻的AI自動生成。生成式對抗網絡(GAN)是近年來復雜分布上無監督學習最具前景的方法之一。模型通過框架中兩個模塊:生成模型和判別模型的互相博弈學習產生輸出。判別模型負責判斷一個實例是真實的還是模型生成;而生成模型負責生成實例來騙過判別模型。兩個模型對抗中最達到平衡,即生成模型生成的實例與真實的沒有區別,判別模型無法區分輸入數據是生成的還是原始真實的數據。
生成式對抗網絡(GAN)模型原理
GAN 模型是一種應用廣泛的人工智能底層框架,可用于逼真圖片生成、圖片翻譯、3D 建模等領域。然而,早期的 GAN 模型存在一些問題,如收斂不穩定、容易受到部分圖片樣本欺騙等,導致初期生成的圖像可能存在失真問題,適用范圍相對局限。盡管如此,隨著技術的不斷發展和改進,GAN 模型已經成為了 AIGC 重要的底層框架之一。
四、第四次 AI 浪潮,AIGC 從文本拓展至圖像及音視頻領域,商業化空間打開
AIGC 在圖片、音視頻領域的模型在大模型基礎上持續優化,性能趨向商用化需求,空間有望打開。我們認為以 ChatGPT 為代表,AI 將進入創造(創作)時代,引領第四次人工智能浪潮。AIGC 以自動化生產和高效為兩大特點,目前已經可以自動生成文字、圖片、音頻、視頻,甚至 3D 模型和代碼。未來大量數字原生內容有望由 AI 協助完成創作。底層技術的突破使 AIGC 商業落地成為可能,模型迭代推動 AI 生成文字和圖片質量實現質的提升。在圖像生成領域,AIGC 的模型已經實現了質的飛躍,為AI生成高質量圖像提供了更多可能性。
AI 圖像生成模型發展梳理
Diffusion模型參考了熱力學原理,大幅提高了生成圖像的穩定性、準確性以及計算效率。該模型的靈感來自于非平衡熱力學,訓練過程中緩慢地將隨機噪聲添加到數據中,然后通過反轉這個噪聲過程來學習恢復數據。與GAN模型不同,擴散模型不依賴于生成與對抗兩個模型的博弈,因此學習結果更加穩定,并且模型的并行性和擴展性更好。之后推出的Stable Diffusion模型在計算效率上顯著提升,滿足企業級和消費級的使用需求。
CLIP模型打破了傳統分類器的界限,可以在不需要額外訓練集的情況下,以良好的性能完成各種計算機視覺任務。該模型對問題進行了重新定義,不再預測文本標簽,取而代之的是預測圖像與文本相匹配的可能性大小。在大規模數據集上完成的訓練后,該模型能夠學習到圖像的各方面信息。在圖像生成領域,這兩個模型的結合可以幫助我們生成更加穩定、準確的圖像。
幾種圖像生成模型特點對比
Make-A-Video 模型是一種基于文本和圖像智能生成視頻的人工智能技術。該技術繼承了圖像生成模型的核心技術,通過對文本語義和圖像對應關系的學習,結合視頻幀序列的訓練,實現了連貫運動且高分辨率的高質量視頻生成。然而,由于模型訓練量要求過大,目前該技術只能實現幾秒鐘的短視頻生成。未來,隨著模型的迭代和優化,有望實現更長時間和更高質量的視頻生成。
Make-A-Video 實現 AI 自動生成短視頻
賦能千行百業
引領數字化未來
AIGC產業鏈已初步形成,其最上層為算力層,為算法層提供算力支持;第二層為算法基礎層,通過數據收集、標注、注釋為算法中間層提供原材料;第三層為算法中間層,通過AI模型開發、訓練生成垂直化、場景化、個性化的模型;最后層級為應用層,利用人工智能生成內容,包括文字、圖片、音視頻等服務內容。
預計AIGC將朝著標準化SAAS服務模式發展,隨著兼具大模型和多模態的AIGC模型加速生成新的技術平臺,SAAS有望加速落地,相關應用層可通過鏈接平臺相關算法從而打開海量應用市場。此外,目前OPEN商業模式即API接口收費,公司通過提供相關AIGC代碼,提供自動圖形模型或語言模型生成等產品,用戶通過其API接口接入,并支付平臺費用獲取相關圖像、語言、代碼調整服務,OpenAI可獲得付費訂閱式的SAAS費用,該商業模式用戶粘性極強。
AIGC產業雛形
一、搜索引擎
Microsoft Bing是由微軟推出的搜索引擎,于2009年5月28日正式上線。截至2013年5月,Bing已成為北美地區第二大搜索引擎,市場份額達到29.3%。Bing集成了網頁、圖片、視頻、詞典、翻譯、資訊、地圖等全球信息搜索服務,并引入了AIGC的搜索引擎,使搜索更便捷、溝通更高效、功能更多元,且AI答案的可靠性得到提升。
最近,Bing推出了一款新版,加入了AI輔助功能。用戶可以通過點擊搜索欄的“聊天”選項,通過與AI聊天的方式獲得答案或建議,還可以通過和搜索框對話來調整答案,從而達到更精準的搜索效果。不同于ChatGPT,新版Bing同時提供引用來源,提高答案可靠度。此外,新版必應不僅具有傳統搜索引擎功能,也可以像智能語音助手一樣根據用戶需求生成出行計劃,及完成如寫詩、創作短篇小說等ChatGPT的傳統藝能。
新版Microsoft Edge功能于2月8日發布,將加入AI聊天和相關寫作功能。除聊天功能外,這些寫作功能可以有效幫助用戶對長文章歸納總結提煉重點、對比篩選文章內容以及創造新內容。此外,新版Bing可以協助用戶生成內容,包括電子郵件、規劃旅行等。
引入ChatGPT功能的BING主頁界面 用戶可以和新版BING搜索引擎交流
二、新聞媒體
BuzzFeed是一家致力于從數百個新聞博客那里獲取訂閱源,為用戶提供方便瀏覽當天網上最熱門事件的新聞聚合網站。該網站被譽為媒體行業的顛覆者。
現在,BuzzFeed計劃利用AIGC技術來有效代替人類對已有信息進行語言整合和文字輸出,與資訊平臺類的數字媒體高度適配。據澎湃新聞報道,BuzzFeed于1月底宣布將使用OpenAI開放的API協助創作內容,并計劃在2023年將把由AI創造的內容從研發階段轉變為核心業務的一部分。具體來說,BuzzFeed將利用人工智能技術創建面向用戶的個性測驗,并根據用戶反應生成個性化的文本內容。人工智能將協助創作過程,加強部分內容創作,而人類則扮演提供想法、“文化貨幣”和“靈感提示”的角色。
BuzzFeed頁面
三、客戶管理
LivePerson是一家網絡交易業務的領先供應商,提供一種云技術平臺,幫助企業通過多種渠道(包括網站、社交媒體和移動設備)主動與消費者聯系。該平臺提供交談、語音和內容交付等多種聯系方式,是客戶參與解決方案的全球領導者。公司的交易業務通過各種消費者和商業數據(包括歷史、行為、業務驅動和第三方數據)的信息來源提煉,每一筆交易的背后都有著專業的分析和對于消費者需求和商業目標之間的實時信息支持。
此外,LivePerson在2022年9月與人工智能企業Afiniti合作,提高服務質量降本增效。根據美國商業資訊,LivePerson在引入AI技術后,品牌方可以在幾毫秒內根據歷史數據模式將個人與客服人員匹配,考慮因素包括客戶的產品使用情況、使用年限,以及過去與該公司聯系的原因。該過程還考慮了客服人員信息,例如他們如何處理類似的信息互動,以盡可能達成積極的客戶-客服人員體驗,獲得有效結果。
LivePerson主頁截圖
四、數字人
2020年,百度推出了國內首個可交互虛擬偶像“度曉曉”,具備視覺識別能力和最自然的交流方式,讓搜索過程和結果反饋更接近人類真實的溝通體驗。度曉曉可以輕松知道人類已有記錄的所有知識,為用戶提供權威且精準的知識服務。在與用戶的交互中,度曉曉能夠默默學習人類的思維實現自我進化。2021年,百度與榮耀聯合打造了國內首個虛擬偶像AIGC單曲《每分 每秒 每天》,由度曉曉與龔俊數字人聯合演唱。數字人在電商直播、新聞播報、接待指引和展覽展示等領域均有已落地的應用,越來越多的企業使用和打造AI虛擬數字人,市場前景十分廣闊。
五、游戲
AIGC(Artificial Intelligence Game Character)是一種基于人工智能技術的游戲角色,它可以在游戲中自主地行動、思考和決策,從而提高游戲的趣味性和挑戰性。以下是AIGC在游戲領域的應用:
1、智能對戰
AIGC可以作為游戲中的對手,通過學習和適應玩家的行為,提高游戲的難度和挑戰性。
2、智能伙伴
AIGC可以作為游戲中的隊友或伙伴,與玩家合作完成任務,提供更加真實的游戲體驗。
3、智能敵人
AIGC可以作為游戲中的敵人,通過學習和適應玩家的行為,提高游戲的難度和挑戰性。
4、智能NPC
AIGC可以作為游戲中的非玩家角色,與玩家進行互動,提供更加真實的游戲體驗。
5、智能劇情
AIGC可以通過學習和適應玩家的行為,自主地生成游戲劇情,提高游戲的趣味性和可玩性。
AIGC:助力廠商實現
數字化轉型的利器
我們認為AIGC的出世將會產生革命性的影響,并有望賦能千行百業。為此,我們梳理了三條路徑圖,積極地推薦以下三條投資主線:
第一條主線是具備算力基礎的廠商,受益標的為寒武紀、商湯、海光信息、浪潮信息、中科曙光、景嘉微、藍海大腦等。這些公司都具備強大的算力基礎,能夠為AIGC的發展提供有力的支撐。
第二條主線是具備AI算法商業落地的廠商,重點推薦科大訊飛、拓爾思等。此外,漢王科技、海天瑞聲、云從科技等公司也將受益于AIGC的發展。
第三條主線是AIGC相關技術儲備的應用廠商,受益標的為百度、同花順、三六零、金山辦公等。這些公司都擁有豐富的AIGC技術儲備,能夠在應用領域中發揮重要作用。
一、科大訊飛:自然語言處理的全球龍頭廠商
科大訊飛于2022年初發布了“訊飛超腦 2030 計劃”,旨在成為“全球人工智能產業領導者”。該計劃是公司的核心戰略,旨在構建基于認知的人機協作、自我進化的復雜系統,讓機器人感官超越人類,具備自主進化的能力,打造可持續自主進化的復雜智能系統,助力機器人走進千家萬戶。
該計劃分為三個階段性里程碑:第一階段(2022-2023)推出可養成的寵物玩具、仿生動物等軟硬件一體機器人,同期推出專業數字虛擬人家族,擔當老師、醫生等角色;第二階段(2023-2025)推出自適應行走的外骨骼機器人和陪伴數字虛擬人家族,老人通過外骨骼機器人能夠實現正常行走和運動,同期推出面向青少年的抑郁癥篩查平臺;第三階段(2025-2030)最終推出懂知識、會學習的陪伴機器人和自主學習虛擬人家族,全面進入家庭。
“訊飛超腦”計劃和里程表
二、漢王科技:人工智能領域領先者
漢王科技是一家成立于1998年的人工智能領域領先者,專注于人臉識別、大數據、智能交互技術、產品及服務的提供。公司以核心技術為基礎,面向市場需求,已形成了以識別技術為核心的、針對不同細分市場的軟硬件產品系列,既有通用產品,如e典筆、漢王電紙書、漢王筆、文本王、名片通、繪圖板等。公司主營業務分為四類:
筆智能交互業務、文本大數據業務、人臉及生物試別與相關AI終端。其中,筆智能交互業務是公司的核心業務之一,公司在該領域的技術主要分為電磁觸控及電容觸控兩大類,是全球僅有的兩家擁有無線無源電磁觸控自主知識產權的企業之一。此項業務包括數字繪畫、電容筆、無紙化簽章等。
文本大數據業務則依托 AI 文本圖像識別技術、NLP 技術、RPA技術平臺,在各行業賽道中尋找數字化、智能化的落地場景,包括智慧司法、智慧檔案、智慧人文、智慧教育、智慧金融等。
人臉及生物試別與相關AI終端則是公司的另一重要業務,涉及人臉識別、指紋識別、虹膜識別等技術,為各行業提供安全、便捷的身份認證解決方案。
漢王科技相關大數據產品及解決方案
三、拓爾思: 全文檢索技術的始創者
拓爾思成立于1993年,是一家領先的大數據、人工智能和數據安全產品及服務提供商。公司主要核心業務包括軟件平臺產品研發、行業應用系統解決方案和大數據SaaS/DaaS云服務三大板塊,涵蓋大數據、人工智能、互聯網內容管理、網絡信息安全和互聯網營銷等領域方向。
公司技術實力雄厚,人工智能領域方面,公司是國內最早從事自然語言處理(NLP)研發的企業之一,在NLP、知識圖譜、OCR、圖像視頻結構化領域都具備自主可控的底層技術。在大數據方面,數據采集、挖掘、分析等底層技術均實現技術可控。
公司行業領域覆蓋廣,由于公司人工智能和大數據核心技術具有跨行業/領域的通用普適性,因此公司技術產品和服務所支持的業務應用落地場景眾多,涵蓋多個行業/領域,大型或頭部企業級客戶超過8000家,廣泛覆蓋于金融、制造、能源、互聯網、傳媒、政府、公共安全等領域。
拓爾思數據應用相關產品
四、云從科技: 人機協同生態體系賦能商
云從科技是一家專注于提高人機操作系統和行業解決方案的人工智能企業。公司致力于推進人工智能產業化進程和各行業的轉型升級。為此,公司通過業務、硬件設備、軟件應用,為客戶提供數字化、智能化的人工智能服務。同時,公司基于人機協同操作系統,賦能金融、出行、商業等場景。為了實現這一目標,公司自主研發了融合人工智能技術的人機協同操作系統和部分AIoT設備。
公司的人機操作系統是一款自主研發的人工智能應用操作系統,包含AIoT設備、人工智能算法和引擎、AI模型和訓練等核心模塊。該系統實現了AI能力的自動部署、監控和邊端感知。通過底層AI業務流程引擎和決策支持系統,該系統優化了人機交互體驗,提升了業務流程執行效率,讓人機具有決策功能。該系統包含人機協同和整體操作系統、“輕舟平臺”的服務平臺及配套AI應用的SaaS服務。
2、人工智能解決方案
云從科技提供面向智慧金融、智慧治理、智慧出行、智慧商業四個領域的綜合解決方案,基于自主研發的人機操作系統及其應用產品和AIoT硬件設備。同時,我們還提供該領域的定制化軟件開發服務,以滿足客戶的個性化需求。我們致力于為客戶提供高效、智能、安全的解決方案,幫助客戶實現數字化轉型和業務升級。
云從科技產品服務體系
五、海天瑞聲: AI訓練數據服務領軍者
海天瑞聲是中國領先的訓練數據專業提供商,專注于為人工智能產業鏈上的各類機構提供算法模型開發訓練所需的專業數據集。公司的訓練數據涵蓋智能語音、計算機視覺、自然語言等多個核心領域,全面服務于人機交互、智能駕駛、智慧城市等多種創新應用場景。
公司的產品和服務已獲得阿里巴巴、騰訊、百度、科大訊飛、??低?/u>、微軟、亞馬遜、三星等國內外客戶的認可,應用于其研發的個人助手、智能音箱、語音導航、搜索服務、智能駕駛、機器翻譯等多種人工智能產品相關算法模型的訓練過程中。
公司具備多重技術領先性,包括算法與數據處理技術并用、工具和平臺共建、在語音語言學基礎研究方面有深厚積累等,公司可提供數據的一站式解決方案,廣泛支持復雜的算法數據標注需求。
云從科技產品服務體系
AIGC未來發展方向
一、AI 發展帶動基礎數據市場成長,高質量標注數據決定模型訓練效果
隨著AI模型的發展,訓練數據的需求不斷增加,而數據標注和結構化處理則成為將數據轉化為商業價值的關鍵步驟。隨著AI與各個產業的結合越來越緊密,AI商業化程度進入新階段,企業對AI在商業化落地中的表現要求越來越高。為了保證AI算法的識別精度,數據標注的質量也變得至關重要。
AIGC向圖像、語音、文字等多維數據延伸,AI基礎數據服務與治理賽道有望受益加速成長。數據服務利用數據采集與標注工具處理非結構化數據,數據治理則使用數據治理的各模塊管理多源異構數據,提高數據質量并形成數據資產。高質量的數據可供各行業AI廠商訓練模型,并支撐各場景商業化產品的落地。
目前,數據標注仍以人工為主,但行業正向智能化和去人工化方向發展,標注數據生產效率與AI模型進步協同共振。不同于計算機視覺領域AI模型訓練所用的圖像數據,NLP模型訓練的數據往往來自于半結構化或非結構化的信息,目前無法實現AI算法模型的自動化標注。目前主流的實現路徑是人工標注與智能標注協同方案,即人工完成一小部分的數據標注,再借助算法模型對剩余數據進行標注,通過人工對部分難例數據樣本的二次標注后,最終形成高質量的標注數據。
AI 訓練數據智能標注服務實現路徑
二、場景模型持續簡化以提升訓練速度,控制成本滿足商業化應用需求
大型模型的微調和維護成本過高,這是目前大型模型廠商在面對用戶需求時所面臨的問題。如果僅提供推理服務,成本可以大幅降低,但是模型精度會受到較大的犧牲,從而降低大型模型的競爭力。此外,AI項目通常需要將模型部署到終端,對算力的要求非常高,因此國內外大廠及研究院所均致力于對預訓練模型進行“瘦身”。
模型蒸餾和遷移學習成為AI領域的研究新方向,可以大幅優化終端模型計算的時效性并節約算力成本。知識蒸餾是一種新的概念,類似于學校中的教學行為,可以有效地壓縮預訓練模型的大小。知識蒸餾包含已訓練的Teacher Model和待訓練的Student Model,通過知識蒸餾和遷移學習,學生網絡可以擁有與教師網絡相似和相近的計算性能。知識蒸餾可以在基于高度復雜的大型模型訓練基礎上,提升細分任務小模型的計算精度,同時也可以有效降低模型延遲,并且壓縮網絡參數。
基于知識蒸餾思想改進BERT預訓練模型,實現模型的簡化和速度的提升。Distilled BERT模型直接將BERT的部分參數作為初始化,模型參數只有BERT的約40%,但速度快提升60%,同時保留了97%的語言理解能力。我們認為,在人工智能通往商業化應用的道路上,早期專注于增加數據量、計算能力或者訓練過程的優化方式可能不再適用,未來各大廠商需要計算與預測性能之間做出權衡,探索如何利用更少的數據與計算資源,幫助模型實現性能提升。
三、AI 應用落地拉動算力需求,AI 基礎設施市場規模有望加速成長
高算力支持是訓練AI大規模商業化的基礎,AI基礎設施市場有望迎來爆發。微軟入資OpenAI后雙方達成多年的合作協議,OpenAI接入微軟的Azure云平臺開發AI技術。高算力的底層基礎設施是完成對海量數據處理、訓練的基礎。我們認為AI技術發展逐漸成熟,數字化基礎設施不斷建設完善,將拉升AI芯片、AI服務器的市場需求。AI商業化應用的加速落地,將推動我國AI基礎設施市場規模的加速成長。
我國 AI 芯片市場規模趨勢
根據《2022-2023中國人工智能計算力發展評估報告》,全球AI服務器市場規模預計將在2026年達到347.1億美元,五年復合增長率為17.3%。這一市場規模的加速成長,將有望為國內細分賽道的龍頭廠商帶來更多的機遇和收益。中商產業研究院的數據預計,到2023年,我國的AI芯片市場規模將達到1206億元,云計算市場規模將達到6975億元,同比分別增長41.9%和47.0%。AI基礎設施市場規模也將快速成長。
我國云計算市場規模趨勢
總結
隨著人工智能技術的不斷發展,智能化時代已經到來。在這個時代,人工智能技術已經成為了各行各業的重要工具,為企業和個人帶來了許多新的機遇。其中,AIGC(Artificial Intelligence and Global Citizenship)作為一種新型的人工智能技術,更是為智能化時代的發展帶來了新的機遇。
AIGC是一種基于人工智能技術的全球公民意識,它通過智能化的方式來推動全球公民意識的發展。在AIGC的幫助下,人們可以更好地理解全球公民意識的重要性,并且更好地參與到全球公民意識的建設中來。同時,AIGC也可以通過智能化的方式來幫助企業和個人更好地適應智能化時代的發展。
在智能化時代,AIGC為企業和個人帶來了許多新的機遇。首先,AIGC可以幫助企業更好地適應智能化時代的發展。通過AIGC的幫助,企業可以更好地了解全球公民意識的重要性,并且更好地參與到全球公民意識的建設中來。這樣,企業就可以更好地適應智能化時代的發展,并且更好地滿足消費者的需求。
其次,AIGC也為個人帶來了許多新的機遇。在智能化時代,個人需要具備更多的技能和知識,才能更好地適應智能化時代的發展。通過AIGC的幫助,個人可以更好地了解全球公民意識的重要性,并且更好地參與到全球公民意識的建設中來。這樣,個人就可以更好地適應智能化時代的發展,并且更好地實現自己的夢想。
除此之外,AIGC還可以為智能化時代的發展帶來許多新的機遇。首先,AIGC可以幫助人們更好地了解全球公民意識的重要性,并且更好地參與到全球公民意識的建設中來。這樣,人們就可以更好地理解全球公民意識的重要性,并且更好地推動全球公民意識的發展。其次,AIGC還可以通過智能化的方式來幫助人們更好地適應智能化時代的發展。這樣,人們就可以更好地適應智能化時代的發展,并且更好地實現自己的夢想。
總之,AIGC與人工智能技術一起,為智能化時代的發展帶來了許多新的機遇。通過AIGC的幫助,企業和個人可以更好地適應智能化時代的發展,并且更好地實現自己的夢想。同時,AIGC也可以通過智能化的方式來推動全球公民意識的發展,為全球公民意識的建設帶來新的機遇。因此,我們應該更加重視AIGC與人工智能技術的發展,為智能化時代的發展做出更大的貢獻。
審核編輯黃宇
-
人工智能
+關注
關注
1791文章
47294瀏覽量
238578 -
深度學習
+關注
關注
73文章
5503瀏覽量
121182 -
ChatGPT
+關注
關注
29文章
1562瀏覽量
7695 -
AIGC
+關注
關注
1文章
362瀏覽量
1545
發布評論請先 登錄
相關推薦
評論