2023年12月22日,首屆“通智杯”人工智能創(chuàng)新應(yīng)用大賽期間,通用人工智能與工業(yè)融合創(chuàng)新中心編制的《AI大模型工業(yè)應(yīng)用現(xiàn)狀、模式與展望》正式發(fā)布。
以下為主要內(nèi)容。
一、背景與意義
黨中央、國務(wù)院高度重視人工智能發(fā)展,習(xí)近平總書記指出,人工智能是引領(lǐng)這一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù),具有溢出帶動性很強的“頭雁”效應(yīng)。今年4月,中央政治局會議強調(diào),要重視通用人工智能發(fā)展,營造創(chuàng)新生態(tài),重視防范風(fēng)險。剛剛結(jié)束的中央經(jīng)濟工作會議再次強調(diào),要大力推進新型工業(yè)化,發(fā)展數(shù)字經(jīng)濟,加快推動人工智能發(fā)展。
通用人工智能大模型(以下簡稱“大模型”)作為人工智能從專用化邁向通用化的發(fā)展新階段,是集智能感知、智能分析、智能決策、智能執(zhí)行等功能于一體的泛在智能技術(shù),通過數(shù)據(jù)、算力、算法三要素深度融合,實現(xiàn)生產(chǎn)要素優(yōu)化配置。
從生產(chǎn)結(jié)構(gòu)來看,人工智能技術(shù)已成為現(xiàn)代工業(yè)生產(chǎn)的核心組成部分,能夠大幅提高生產(chǎn)效率、優(yōu)化資源配置、降低生產(chǎn)成本,為新型工業(yè)化發(fā)展提供強大的技術(shù)支持和動力。通用人工智能與制造業(yè)深度融合,可以進一步加速工業(yè)體系向高端化、智能化、綠色化邁進。為貫徹落實黨中央國務(wù)院決策部署,推動新一代信息技術(shù)加速賦能新型工業(yè)化,中國工業(yè)互聯(lián)網(wǎng)研究院籌備組建了通用人工智能與工業(yè)融合創(chuàng)新中心,深度聚焦大模型底座、架構(gòu)、標準和應(yīng)用等方面,開展了系列專題調(diào)研,總結(jié)并展望大模型在工業(yè)場景中七類可復(fù)制可推廣的應(yīng)用新模式,為大模型向制造業(yè)縱深拓展提供參考依據(jù)。
二、大模型及其工業(yè)應(yīng)用發(fā)展總體情況
一方面,全球范圍掀起大模型發(fā)展浪潮。大模型的出現(xiàn)將人工智能推向新的發(fā)展階段,國內(nèi)外龍頭企業(yè)成為大模型角力的技術(shù)高地。AI大模型是具有大規(guī)模參數(shù)和復(fù)雜結(jié)構(gòu)的人工智能模型,隨著模型增大、訓(xùn)練數(shù)據(jù)量增多以及計算能力提升,AI大模型在自然語言處理、圖像識別、語音識別和多模態(tài)識別領(lǐng)域取得了重要突破,自2020年以來,大模型在全球范圍內(nèi)市場規(guī)模迅速增長,迎來爆發(fā)期。根據(jù)Precedence Research測算,預(yù)計到2023年底,全球大模型市場規(guī)模將達到137億美元,2032年大模型市場規(guī)模將達到1181億美元。國外方面,OpenAI作為業(yè)界領(lǐng)先機構(gòu)已發(fā)布語言類大模型ChatGPT(2022)和GPT-4(2023)、語音大模型Whisper(2022)、視覺大模型DALL-E(2021),微軟將GPT-4相關(guān)能力整合入Windows 11系統(tǒng)、office365、Bing等重點產(chǎn)品形成Copilot系列應(yīng)用;同時,谷歌推出多模態(tài)大模型Gemini(2023),Meta發(fā)布語言大模型LLaMA(2023),國外科技巨頭紛紛加入大模型競賽。國內(nèi)方面,各科技企業(yè)亦積極跟進全球大模型發(fā)展趨勢,百度發(fā)布語言大模型“文心一言”、阿里發(fā)布語言大模型“通義千問”、科大訊飛發(fā)布語言大模型“星火認知”、百川智能發(fā)布“百川大模型”、智譜AI發(fā)布ChatGLM系列語言大模型、中科院發(fā)布跨模態(tài)大模型“紫東太初”。
另一方面,大模型向B端尤其是工業(yè)領(lǐng)域應(yīng)用已成為行業(yè)共識。大模型已呈現(xiàn)出以基礎(chǔ)大模型為技術(shù)底座,工業(yè)應(yīng)用為切入點的發(fā)展趨勢,工業(yè)大模型概念應(yīng)運而生。基礎(chǔ)大模型(Foundation Model)通過提升模型的參數(shù)量和結(jié)構(gòu)通用性,融合和表達更多領(lǐng)域知識和模態(tài)知識,形成全知全能的通用模型。而工業(yè)大模型依托基礎(chǔ)大模型的結(jié)構(gòu)和知識,融合工業(yè)細分行業(yè)的數(shù)據(jù)和專家經(jīng)驗,形成垂直化、場景化、專業(yè)化的應(yīng)用模型。工業(yè)大模型相對基礎(chǔ)大模型具有參數(shù)量少、專業(yè)度高、落地性強等優(yōu)勢,可以為工業(yè)垂直領(lǐng)域的技術(shù)突破、產(chǎn)品創(chuàng)新、生產(chǎn)變革等提供低成本解決方案。
?
三、大模型工業(yè)應(yīng)用七大模式
工業(yè)產(chǎn)品從全生命周期來看可以劃分為研發(fā)、設(shè)計、仿真、生產(chǎn)、測試、運維、售后等環(huán)節(jié),本報告針對各環(huán)節(jié)的特點和要素進行分析,并結(jié)合大模型自身的能力特征,初步提出以下大模型在工業(yè)領(lǐng)域的潛在應(yīng)用模式。
模式一:原理化研發(fā)
大模型可以對產(chǎn)品的結(jié)構(gòu)數(shù)據(jù)進行分析,從微觀層面探究產(chǎn)品的構(gòu)型和機理,并通過模型的涌現(xiàn)能力生成具有新結(jié)構(gòu)、新特性的產(chǎn)品。
以藥物研發(fā)為例,人工智能大模型可以通過分析大量的已知藥物分子數(shù)據(jù),從中找出最優(yōu)的藥物候選,并生成一個新的藥物分子設(shè)計方案,從而大大縮短藥物研發(fā)的時間和成本,提高藥物研發(fā)的成功率。
靶點發(fā)現(xiàn)和藥物結(jié)構(gòu)設(shè)計。靶點發(fā)現(xiàn)是藥物研發(fā)過程中的核心環(huán)節(jié),其中靶點是藥物在體內(nèi)的作用結(jié)合位點,藥物與靶點之間的關(guān)系可以類比于鑰匙和配套的鎖。傳統(tǒng)的靶點發(fā)現(xiàn)需要做大量的科研工作,對靶點做大量的生物學(xué)假設(shè),并設(shè)計一系列的實驗進行驗證,需要漫長的周期。而大模型通過分析已知的藥物分子結(jié)構(gòu)數(shù)據(jù)、藥物分子與疾病相關(guān)性的知識圖譜,從中找出與疾病靶點相互作用的分子特征,然后利用這些分子特征,自動地生成新的藥物分子設(shè)計方案。
藥物方案評估和優(yōu)化。在生成若干藥物分子設(shè)計方案后,模型可以在人工提示下,對生成的設(shè)計方案進行評估,篩選出最有前景的藥物候選。同時可以通過藥物分子的結(jié)構(gòu)和性質(zhì),優(yōu)化其藥效和毒性,通過預(yù)測藥物的代謝途徑和藥物濃度,優(yōu)化藥物的劑量和用藥方案。
輔助臨床實驗設(shè)計。實驗驗證是藥物研發(fā)中必不可少的環(huán)節(jié),但是實驗通常需要消耗大量的時間和資源。人工智能大模型可以幫助研究人員設(shè)計更有效的臨床試驗方案,例如預(yù)測藥物的安全性和有效性,優(yōu)化臨床試驗的樣本規(guī)模和時間等。通過預(yù)測和篩選,減少實驗的數(shù)量和復(fù)雜度,從而提高藥物研發(fā)的效率和質(zhì)量。
模式二:前瞻化設(shè)計
大模型可以生成創(chuàng)新性的產(chǎn)品設(shè)計方案,從而更好地輔助技術(shù)人員快速將設(shè)計構(gòu)思和意圖轉(zhuǎn)化為具體實施方案。
以傳統(tǒng)工業(yè)設(shè)計為例,大模型可以實現(xiàn)工程制圖、設(shè)計方案的快速生成,并輔助進行布局優(yōu)化、參數(shù)校核,大幅縮減工業(yè)設(shè)計耗時,提升產(chǎn)品研發(fā)效率。
數(shù)學(xué)建模和代碼編寫。在工業(yè)設(shè)計過程中,很多問題需要建立特定的數(shù)學(xué)模型進行分析求解,例如機械產(chǎn)品設(shè)計中常遇到諸如力學(xué)強度校核、尺寸優(yōu)化、標準零件選型等問題,邀請專家專門分析和建模成本高。而大模型可以根據(jù)具體設(shè)計需求,在短時間內(nèi)為這些問題提供參考方案,并自動生成相應(yīng)的程序代碼,指導(dǎo)進行具體的工業(yè)設(shè)計實踐。
多樣化設(shè)計方案生成。以CAD為例,現(xiàn)有的海量標準化素材庫提供了大量工程制圖、布局規(guī)劃等數(shù)據(jù),大模型可以利用這些數(shù)據(jù),結(jié)合設(shè)計者的創(chuàng)意思路和特殊需求,生成多樣化的設(shè)計方案,供設(shè)計者進行參考。另一方面,亦可對設(shè)計方案進行快速優(yōu)化調(diào)整,幫助工程師以更快的速度和更少的錯誤率創(chuàng)建布局。
模式三:高效化仿真
大模型可以利用自身的生成能力提供符合設(shè)計需求的虛擬化仿真測試場景/環(huán)境,解決工業(yè)產(chǎn)品設(shè)計中測試數(shù)據(jù)量少、測試環(huán)境單一等問題,提升產(chǎn)品的可靠性。
以汽車制造為例,通過人工智能大模型來生成仿真測試環(huán)境,進行汽車碰撞模擬和安全性評估,可以大幅提升仿真的精度和效率,推動車輛設(shè)計和安全性能的提升。
多元化仿真場景生成。汽車企業(yè)在車輛實際測試、模擬實驗中積累了大量的真實數(shù)據(jù),包括車輛結(jié)構(gòu)、碰撞數(shù)據(jù)以及材料特性等信息。大模型可以利用這些數(shù)據(jù)學(xué)習(xí)車輛結(jié)構(gòu)、材料屬性與碰撞響應(yīng)之間的非線性關(guān)系,理解不同參數(shù)(如碰撞速度、角度、車輛構(gòu)造等)對于碰撞響應(yīng)的影響,并通過自身的涌現(xiàn)能力生成新的、多樣化的碰撞場景。這有可以讓車輛模型在不同情況下進行仿真預(yù)測,包括之前未經(jīng)歷過的情形,并彌補特殊場景中的數(shù)據(jù)缺失,提升汽車仿真測試的全面性和準確性。
參數(shù)優(yōu)化與快速預(yù)測。傳統(tǒng)的車輛碰撞仿真中,需要采用不同的參數(shù)組合進行多輪次測試,以獲得最佳結(jié)果,而每次測試需要花費大量的時間進行人工調(diào)參。而大模型可以憑借零樣本的知識分析能力,通過問答形式,對不同的參數(shù)組合,快速預(yù)測出碰撞響應(yīng)情況。這有助于在短時間內(nèi)找到最佳參數(shù)組合,以減少車輛設(shè)計和測試的周期。同時,它可以在考慮歷史碰撞案例的基礎(chǔ)上,提供新穎的設(shè)計建議,可能涉及材料選擇、構(gòu)造調(diào)整等方面的創(chuàng)新。
模式四:精細化檢測
通過大模型的零樣本學(xué)習(xí)能力,并結(jié)合AR/VR等虛擬現(xiàn)實技術(shù),實現(xiàn)對產(chǎn)品質(zhì)量缺陷、人員違規(guī)操作、零部件裝配誤差等多種工業(yè)場景的快速高效視覺檢測。
以工業(yè)生產(chǎn)中的質(zhì)量檢測和安全監(jiān)測等場景為例,通過外接視覺傳感裝置和簡單的指令輔助,大模型可以根據(jù)需求對指定的區(qū)域、人員進行檢測,快速發(fā)現(xiàn)異常信息,大幅降低人工查驗、樣本收集和模型訓(xùn)練等成本。
高效率工業(yè)質(zhì)量檢測。以PCB的瑕疵檢測為例,通用視覺大模型可以憑借強泛化能力,在不依賴工廠樣本數(shù)據(jù)和本地化微調(diào)訓(xùn)練的情況下,直接對PCB原始圖像進行語義分割,再配合簡單設(shè)置的規(guī)則及方法實現(xiàn)缺焊、連焊、針孔等各類瑕疵的識別,從而解決PCB樣本數(shù)據(jù)獲取困難、標注困難的實際問題,規(guī)避訓(xùn)練調(diào)參帶來的高額成本,提升工業(yè)產(chǎn)品缺陷檢測的效率。
智能化安全生產(chǎn)監(jiān)管。在煤礦生產(chǎn)行業(yè)中,借助大模型的機器視覺識別技術(shù),結(jié)合設(shè)備運行狀態(tài)數(shù)據(jù),識別危險區(qū)域人員進入、人員摔倒、截割部落地、敲幫問頂、鉆孔深度、錨固劑使用數(shù)量、攪拌時間、二次緊固、錨索張拉等場景,實現(xiàn)掘進作業(yè)人工監(jiān)管向自動監(jiān)控的轉(zhuǎn)變,提升掘進作業(yè)流程規(guī)范,提高煤礦生產(chǎn)的安全系數(shù)。
個性化檢測場景擴展。結(jié)合語言大模型和視覺大模型,進行多模態(tài)感知和交互,擴展大模型在工業(yè)視覺檢測中的應(yīng)用范圍,提升應(yīng)用的靈活性。例如,在工業(yè)質(zhì)檢中,可以通過語音指令控制大模型實現(xiàn)對不同類型、不同區(qū)域、不同等級的缺陷檢測,滿足各類產(chǎn)品的檢測需求。
模式五:智能化調(diào)控
在大型現(xiàn)代化產(chǎn)線中,需要對多個關(guān)鍵節(jié)點進行智能化調(diào)度和控制,以提升產(chǎn)線運行效率。人工智能大模型可以通過分析多樣化的歷史數(shù)據(jù),更好地理解諸如生產(chǎn)需求、資源可用性、任務(wù)優(yōu)先級等工業(yè)調(diào)度任務(wù)中的復(fù)雜關(guān)系,從而優(yōu)化各節(jié)點的任務(wù)分配和調(diào)度,提高生產(chǎn)效率和靈活性。
以工業(yè)機器人為例,大模型可以對各類生產(chǎn)數(shù)據(jù)進行自動整合分析,從而對機器人進行快速的任務(wù)分配和動態(tài)任務(wù)調(diào)整,成為大型工業(yè)產(chǎn)線中的“神經(jīng)中樞”。
復(fù)雜模式學(xué)習(xí)和任務(wù)快速分配。汽車制造等大規(guī)模的生產(chǎn)線上通常配置多臺工業(yè)機器人,負責(zé)組裝、焊接、涂裝等子任務(wù)。人工智能大模型可以收集機器人的性能數(shù)據(jù)、工作站狀態(tài)、生產(chǎn)計劃等信息,并基于這些數(shù)據(jù),學(xué)習(xí)機器人的技能、任務(wù)復(fù)雜性、工作站之間的轉(zhuǎn)移時間等復(fù)雜信息,并預(yù)測不同機器人執(zhí)行不同任務(wù)的效率。當新的任務(wù)到達時,模型可以快速決定分配給哪個機器人,以最大程度地減少任務(wù)等待時間和生產(chǎn)周期。
動態(tài)任務(wù)分配調(diào)整。大模型可以從歷史數(shù)據(jù)中分析機器人的性能和效率,并根據(jù)不同任務(wù)的要求,動態(tài)調(diào)整任務(wù)分配策略。這有助于優(yōu)化機器人的使用,確保它們在不同任務(wù)中都能發(fā)揮最佳作用。如果出現(xiàn)機器人故障、工作站故障或生產(chǎn)計劃變更等情況,大模型可以快速響應(yīng)并重新調(diào)整任務(wù)分配,以應(yīng)對不可預(yù)見的情況。
運動控制代碼生成。從工業(yè)機器人單體運動的層面來看,生產(chǎn)人員可以通過文本、語音等交互方式,根據(jù)不同的任務(wù)需求,通過大模型快速生成定制化的運動控制代碼,以控制機器人執(zhí)行不同的任務(wù)。例如,對大模型輸入指令“請寫一段PLC程序,控制機器人將零件從A點轉(zhuǎn)移到B點”。這種基于大模型的運動控制指令生成模式可以大幅提升工業(yè)機器人的靈活度,實現(xiàn)柔性化的產(chǎn)線控制。
模式六:科學(xué)化運維
大模型可以通過自身強大的推理能力實現(xiàn)對生產(chǎn)過程中各類數(shù)據(jù)的分析、預(yù)測,從而提升智能化運維水平,完善生產(chǎn)管理機制。
以倉儲管理為例,可以利用大模型的對供應(yīng)鏈中各類別、各模態(tài)的數(shù)據(jù)進行管理和整合,提升貨品信息流的運行效率,打造更便捷、更快速的工業(yè)產(chǎn)品供應(yīng)鏈體系。
智能倉儲管理。使用嵌入多模態(tài)大模型的機器人進行貨架管理、庫存管理和訂單揀貨等操作,可以通過大模型的強視覺泛化能力進行自主貨架定位、庫存管理和物品運輸?shù)炔僮?,提升倉庫的運營效率。同時,使用大模型對庫存進行預(yù)測,并根據(jù)銷售速度和庫存周轉(zhuǎn)率等因素制定補貨策略,有助于及時補充庫存,避免庫存短缺影響銷售,同時避免過度補貨,以免造成庫存積壓和資金占用的問題。
高效數(shù)據(jù)管理。工業(yè)生產(chǎn)的供應(yīng)鏈中會涉及大量的數(shù)據(jù),如原材料數(shù)據(jù)、加工工藝數(shù)據(jù)、設(shè)備狀態(tài)信息、環(huán)境信息、人員信息、物流信息等。大模型可以對不同格式、不同來源的數(shù)據(jù)進行快速整理、分類和分析,降低數(shù)據(jù)整理成本。同時這些分類整理后的數(shù)據(jù)可以用于大模型的進一步微調(diào),實現(xiàn)數(shù)據(jù)和模型的良性互動。
模式七:定制化售后
大模型可以憑借在自然語言對話方面的巨大優(yōu)勢,使售后服務(wù)不再拘泥于固定的問答庫,而與客戶形成更加自然、流暢和有效的對話,從而幫助工業(yè)企業(yè)實現(xiàn)滿足不同用戶需求的定制化售后服務(wù),從而進一步提升客戶忠誠度和用戶成長,拓展業(yè)務(wù)范圍。
以機械設(shè)備售后為例,大模型可以結(jié)合多模態(tài)、數(shù)字人等技術(shù),讓客戶通過自然語言描述設(shè)備故障或問題,系統(tǒng)能夠準確理解并提供詳細、個性化的解決方案。
多維度交互式售后服務(wù)。機械設(shè)備的操作及維護需要復(fù)雜的操作,傳統(tǒng)基于知識庫的客服系統(tǒng)無法給予用戶精確的指導(dǎo)。利用大語言模型作為后端邏輯推理支撐、虛擬數(shù)字人作為前端交互形象,系統(tǒng)可以準確理解客戶的需求,結(jié)合自身的知識儲備和具體的問題,迅速給出詳細的、針對性的解決方案。同時,還可以通過虛擬數(shù)字人的手勢和語音交互,從更多維度輔助客戶進行設(shè)備的操作,不僅提高了售后服務(wù)的效率,還為客戶提供了更加直觀和個性化的服務(wù)體驗。
四、下一步發(fā)展建議
現(xiàn)階段,受限于工業(yè)場景碎片化、計算資源不足、工業(yè)領(lǐng)域訓(xùn)練數(shù)據(jù)采集和整理困難、大模型安全性可靠性等問題,我國大模型與工業(yè)的融合應(yīng)用還處于初級探索階段,發(fā)展面臨一定挑戰(zhàn)。一是基礎(chǔ)大模型仍占據(jù)應(yīng)用市場的主體地位,還未能下沉到工業(yè)垂直領(lǐng)域形成專業(yè)化的工業(yè)大模型。二是當前大模型在工業(yè)生產(chǎn)中的應(yīng)用分布較為零散,尚未形成標準化、體系化的大模型工業(yè)應(yīng)用范式。三是從底層構(gòu)建工業(yè)預(yù)訓(xùn)練大模型具有較高門檻,僅有少數(shù)頭部企業(yè)有能力開展工業(yè)大模型的研發(fā)。針對上述問題,提出如下建議:
一是面向工業(yè)場景推進大模型技術(shù)攻關(guān)。梳理面向工業(yè)場景應(yīng)用的大模型共性技術(shù)問題,聚焦安全性、可靠性、實時性等方面,鼓勵專業(yè)領(lǐng)域的高校、企業(yè)、研究機構(gòu)合作開展攻關(guān),通過大模型工業(yè)數(shù)據(jù)集擴充、典型工業(yè)場景規(guī)則集構(gòu)建、模型訓(xùn)練算法優(yōu)化等方式,加強國內(nèi)大模型的技術(shù)研發(fā),推進大模型工業(yè)應(yīng)用能力的提升。
二是構(gòu)建規(guī)?;拇竽P凸I(yè)數(shù)據(jù)資源池。組織大模型供給側(cè)和需求側(cè)企業(yè)及研究機構(gòu),研制工業(yè)大模型訓(xùn)練數(shù)據(jù)規(guī)范和測試標準。依托國家工業(yè)互聯(lián)網(wǎng)大數(shù)據(jù)中心等標準化平臺,建立大模型工業(yè)語料庫,形成工業(yè)數(shù)據(jù)的管理機制。通過資金補貼、稅費減免、政策傾斜等措施,引導(dǎo)國內(nèi)大中型制造業(yè)企業(yè)進行工業(yè)生產(chǎn)運行數(shù)據(jù)的開源共享,形成涵蓋國內(nèi)重點工業(yè)領(lǐng)域的數(shù)據(jù)資源池,為工業(yè)大模型的訓(xùn)練、測試提供數(shù)據(jù)保障。
三是完善大模型工業(yè)領(lǐng)域性能的評測機制。以國家權(quán)威機構(gòu)為依托,協(xié)同各行業(yè)需求方,建立標準化的大模型工業(yè)知識問答測試集,保障評測效率和結(jié)果的可信度。同時應(yīng)建立長效的大模型工業(yè)領(lǐng)域性能評測機制,周期性圍繞大模型知識能力、穩(wěn)定性、安全性等關(guān)鍵性能進行評估工作,并根據(jù)產(chǎn)業(yè)結(jié)構(gòu)、數(shù)據(jù)要素分布的變化對評測指標進行動態(tài)調(diào)整,以促進大模型對新型工業(yè)化賦能的持續(xù)性。
四是推動大模型在工業(yè)領(lǐng)域典型應(yīng)用的試點示范。整合碎片化的工業(yè)場景,提煉出以產(chǎn)品輔助設(shè)計、精細化質(zhì)量檢測、智能供應(yīng)鏈管理等為代表的大模型工業(yè)應(yīng)用典型業(yè)務(wù)場景,明確各場景對大模型的量化需求指標,并推動建立相關(guān)的行業(yè)標準。建立大模型供給側(cè)與企業(yè)應(yīng)用側(cè)之間的雙向交互機制,促進形成若干大模型研發(fā)與制造業(yè)協(xié)同發(fā)展的特色產(chǎn)業(yè)集群,并推動建設(shè)一批工業(yè)大模型的標桿性、示范性應(yīng)用。
審核編輯:黃飛
評論
查看更多