作者簡介
劉乃嘉
中國信息通信研究院工業互聯網與物聯網研究所碩士研究生在讀,主要從事區塊鏈、新型工業互聯網標識、隱私計算等方面的研究工作。
郭健
中國信息通信研究院工業互聯網與物聯網研究所區塊鏈開發工程師,從事區塊鏈底層鏈開發、分布式數字身份等方面的研發工作。
李海花
中國信息通信研究院工業互聯網與物聯網研究所副所長,正高級工程師,主要從事與信息通信相關的政府支撐、戰略咨詢、新技術跟蹤研究、標準研制等工作。
論文引用格式:
劉乃嘉, 郭健, 李海花. 隱私計算在分布式認知工業互聯網中的應用研究[J]. 信息通信技術與政策, 2023, 49(11): 25-32.
隱私計算在分布式認知工業互聯網中的應用研究
劉乃嘉 郭健 李海花
(中國信息通信研究院工業互聯網與物聯網研究所,北京 100191)
摘要:現有的工業互聯網數據在互聯互通過程中存在難以安全共享的問題,工業互聯網發展模式急需創新。首先細化了分布式認知工業互聯網的技術架構,其次探討了工業互聯網領域在數據共享與利用方面的困境,并提出了隱私計算在具體工業應用場景下的解決方案,最后根據實際需求給出了隱私計算在分布式認知工業互聯網中的發展建議。
0 引言
工業互聯網通過實現各個環節的信息共享和協同創新,可以加強供應鏈、生產鏈和銷售鏈之間的協作與優化,進而提升產業鏈現代化水平,對于支撐制造強國和網絡強國建設具有重要意義。2020年,我國出臺了《工業和信息化部辦公廳關于推動工業互聯網加快發展的通知》
,指出了“加快發展工業互聯網基礎設施建設、健全工業互聯網安全保障體系”的必要性。工業大數據作為工業互聯網的核心,承載著從數據的采集、加工到集成,再到建模分析,最后向頂層服務進行決策支撐的能力。如何打破工業互聯網中的“數據孤島”問題,實現工業大數據的隱私保護和價值挖掘成為研究重點。目前,工業互聯網發展已由起步期進入快速發展期。在此階段,研究新一代信息技術(如物聯網、5G通信、邊緣計算、隱私計算等)與工業互聯網的深度融合應用,有助于健全工業互聯網安全保障體系,進一步提高工業互聯網服務實體經濟能力。因此,急需探索適用于工業互聯網創新發展的新型技術模式。
1 工業互聯網核心功能架構
工業互聯網是一種將工業與信息網絡高度融合的網絡,其核心功能是基于數據驅動的物理系統與數字空間進行全面互聯與深度協同,實現各設備廠商的信息集成和共享,以及在此過程中的智能分析與決策優化。如圖1所示,現有工業互聯網的核心功能架構可細分為邊緣層、基礎設施(Infrastructure as a Service,IaaS)層、平臺(Platform as a Service,PaaS)層以及應用(Software as a Service,SaaS)層。邊緣層連接工業互聯網平臺與底層物理資產,提供針對不同工業設備的工業數據接入能力和針對多源異構數據的協議解析與轉換功能。IaaS層主要為工業互聯網平臺提供硬件支撐。PaaS層基于底層通用的資源管理、運維管理、流程管理、數據管理等模塊,為工業建模提供高質量數據源,建立與工業數據模型庫相關的微服務組件,并針對不同場景融合工業機理建模方法和數據科學建模方法,實現工業大數據價值深度挖掘。SaaS層部署工業創新應用,將創新軟件引入工業互聯網平臺中,為用戶提供各種工業應用解決方案。
圖1 工業互聯網核心功能架構
2 分布式認知工業互聯網技術架構
分布式認知工業互聯網概念在2020年首次提出,通過將區塊鏈技術、隱私計算技術、知識圖譜技術深度集成到工業互聯網平臺架構,解決目前工業互聯網尚未解決的問題。借助區塊鏈技術的數據真實、透明、不可篡改等特性,實現更加安全可信的工業制造協同生態;融合應用知識圖譜技術與機器學習技術,有助于深度挖掘工業大數據價值;隱私計算技術作為研究重點,可以在符合數據隱私保護和監管要求的前提下,保障工業數據的可信流轉與高效利用。本文在工業互聯網核心功能架構的基礎上進一步細化了分布式認知工業互聯網架構(如圖2所示),主要分為邊緣層、基礎設施層、區塊鏈層、數據協同層、認知智能層、平臺層、激勵層以及應用層。
圖2 分布式認知工業互聯網技術架構
2.1 邊緣層
邊緣層包括邊緣設備層和邊緣接入管理層。邊緣設備層由各種設備(如傳感器、儀器儀表、智能機器等)組成,與相關工業企業、工業互聯網平臺企業、工業互聯網基礎設施運營企業等進行交互,完成數據接入過程,保障工業數據安全的存儲、分析和計算,高效、精準的數據服務,向區塊鏈提供可信數據。
邊緣接入管理層包含邊緣智能分析、邊緣應用部署與管理、工業數據接入、協議解析、數據預處理等功能組件,通過工業數據可信接入實現與區塊鏈層、PaaS層的信息安全交互。邊緣智能分析對現場生產進行高效精準的優化決策,支持在邊緣端實現分布式的工業智能數據分析和處理,滿足邊緣業務的實時性、可靠性以及多樣化需求。邊緣應用部署與管理組件支持應用管理協同,支持邊緣節點部署運行環境以及相關應用。工業數據接入功能需具備各類異構工業設備的數據接入能力,以及企業資源計劃系統、制造執行系統、倉庫管理系統等系統的數據接入能力。協議解析和數據預處理中,需要進行數據合規性檢查、數據質量檢查以及多源異構數據的轉換與適配,之后進行數據剔除、壓縮、緩存等操作,將敏感工業數據上鏈存儲。
2.2 IaaS層
基于分布式認知的基礎設施包括存儲服務器、計算服務器、應用服務器、網絡設備和安全設備等。其中工業數據的存儲可以通過區塊鏈技術分布在邊緣側,工業數據的多方協同可以通過密文計算來實現,復雜的領域及行業知識可以以圖譜的形式展現。
2.3 區塊鏈層
區塊鏈層將區塊鏈技術集成到工業互聯網平臺架構。區塊鏈技術源于Satoshi Nakamoto 在2008年提出的比特幣系統,該技術可以利用分布式節點來進行數據的存儲及傳輸,已被應用在金融、物流、物聯網等多個領域。其中節點通信主要依賴點對點(Peer to Peer,P2P)網絡,這是一種分布式節點網絡,節點之間相互建立通信鏈接,區塊鏈的P2P架構在面對惡意網絡攻擊時具有更高的安全性和可靠性;節點管理是區塊鏈節點形成P2P網絡所進行的合作,共同完成節點間的數據交互,用于支撐分布式網絡的運轉;智能合約是以信息化方式自動執行合約條款的協議,能夠在無第三方參與的情況下完成可信交易,交易結果可溯源且不可篡改。分布式身份管理支持身份真實性認證,使用安全加密算法和協議生成用戶唯一標識,通過用戶唯一標識可以查詢成員身份信息,不同節點查詢的用戶信息保持一致,基于區塊鏈的數字身份將可識別的用戶身份標識和用戶身份驗證的公鑰信息錨定在區塊鏈上,不再依賴于中心化身份提供商,身份由用戶自己控制。共識機制是分布式的區塊鏈節點就當前時間窗口內的實物達成狀態一致性的方法,是解決區塊鏈網絡中各個節點在分布式系統運行期間的互信問題的關鍵 ,目前廣泛應用的共識機制有工作量證明機制、權益證明機制以及拜占庭容錯算法。跨鏈技術兼容多種異構區塊鏈及跨鏈機制,保障良好的可擴展性,包括可信執行環境驗證機制、公證人機制、側鏈機制等。
2.4 數據協同層
數據協同層將隱私計算技術集成到工業互聯網平臺架構,滿足企業對工業數據可用不可見、可用不可存、可控可計量的需求,其中包括同態加密、安全多方計算、聯邦學習、機密計算、差分隱私等多種關鍵技術,逐漸被劃分為基于密碼學算法、人工智能技術、可信硬件的三大技術方向。安全多方計算以及差分隱私等技術依賴于嚴格的密碼學理論,其中安全多方計算主要有混淆電路、同態加密、秘密分享3種形式,主要面向的是在多個參與方的環境下,每個參與方都擁有自己的私密信息,同時又希望利用其他信息來共同完成計算一個函數的過程。其中差分隱私是針對統計數據庫的隱私泄露問題提出的一種隱私保護技術,通過加噪聲的方式避免原始信息外露,可以去除個體特征,保障數據提供方敏感及隱私數據的安全,在工業互聯網領域中數據敏感性較高的復雜場景有較高的應用價值。聯邦學習依賴于人工智能技術,根據原始數據的分布規律主要分為橫向聯邦學習、縱向聯邦學習及遷移聯邦學習,可以做到各個參與方的自有數據不出本地,而后通過加密機制下的參數交換方式,在保障數據隱私的情況下,建立一個虛擬的最優共有模型。可信執行環境、機密計算等技術依賴于可信硬件,硬件隔離可以保護設備處理器及內存等組件不受用戶安裝應用程序的影響,保證在該環境下所加載的數據和執行的程序的機密性、完整性。
上述3種方向的隱私計算技術側重點不同但仍可以組合使用,在實際應用時的主要計算場景包括安全聯合統計、安全聯合查詢和安全聯合建模等。安全聯合統計包括基礎計算、聯合排序等,安全聯合查詢通過隱私求交、隱匿查詢等方式完成數據查詢任務,安全聯合建模聯合多方數據建立深度學習模型。
2.5 認知智能層
認知層將知識圖譜技術集成到工業互聯網平臺架構。知識圖譜本質上是一種揭示實體之間關系的語義網絡
,其重要性在于推進了異構數據的結構化過程,讓數據建立鏈接關系,為各種算法的介入提供支撐。其在分布式認知工業互聯網架構內的發揮作用有3點,一是將知識圖譜的理解、分析、決策能力賦能到產品全生命周期過程中,從而實現自適應、自優化的產品設計、資源調度、決策管理、流程優化和智能制造;二是以行業和企業內部的數據為主要來源,快速對企業整體運行情況和外部機遇進行分析,輔助戰略布局;三是面向行業/地域的數據集成分析,可有效評估產業健康情況、優化產業格局。
2.6 PaaS層
PaaS層集成了工業大數據管理分析平臺、工業區塊鏈應用開發工具、可視化模型中心及工業微服務等通用平臺能力,同時也可以橫向對接外部成熟的通用工業互聯網平臺,以被集成或相互調用的方式來互為補充。
2.7 激勵層
激勵層的激勵及治理機制是分布式認知工業互聯網架構中的重點,只有在有效的激勵及治理模式下,再依托區塊鏈中的智能合約技術快速開發應用、服務或者小程序,助力行業內適配性相對較低的工業智能應用程序逐步下沉并實現場景化應用。多方參與者實現信息共享是構建工業互聯網互聯互通的前提,激勵層的治理機制主要依托于區塊鏈層的存證和多方驗證的能力,保證價值鏈從生產過程到交付、服務、檢修,形成完整的閉環數據監控;激勵層的激勵機制依托于區塊鏈中的價值交換,通過設計適度的經濟激勵機制激勵區塊鏈中大規模節點參與共識過程。在分布式認知工業互聯網中,通過優化針對信息共享的激勵,實現產業鏈供應鏈上的利益協同。
2.8 SaaS層
SaaS層將多種底層技術在不同的場景中以單一或者組合方式使用出來,形成不同的工業應用。從參與者范圍來看,可以區分為企業內部應用、產業鏈應用、跨產業鏈生態應用。企業內部應用指分布式認知工業互聯網平臺的參與者屬于同一個實體企業;產業鏈應用指參與者屬于相同行業供應鏈上下游之間的關系型企業;跨產業鏈生態應用指參與者不但包括行業供應鏈上下游的實體,還包括為產業鏈提供各種服務的生態機構,如物流、法務、公證、銀行、保險、政府、公共基礎服務機構等。
實際場景中,根據區塊鏈、隱私計算等技術的應用特性,可以構造多種企業內部的工業應用。設備身份認證、設備訪問控制、數據存證等應用較為常見,同時這些應用也可以組合在產業鏈應用和跨產業鏈應用中。在產業鏈應用方面,研發與產銷協同、質量追溯、產品生命周期管理等是較為常見的場景;在跨產業鏈生態應用方面,引入多種類型的企業服務機構(如金融企業、政府、法務等),利用數據在多個參與方之間安全共享的特點,可以打造供應鏈金融、融資租賃、政府監管等多種應用。
3 隱私計算在分布式認知工業互聯網中的應用
3.1 工業產品自動化質檢與可信協作
在離散型工業制造供應鏈上,通常由多個零件生產商為下游企業供應同一規格零件,零件的批量較大,一般采用人工抽樣檢測的方式來進行工件質檢。這也造成了兩個問題,一是隨機抽樣方式不覆蓋所有工件;二是檢測完全依賴檢驗員的業務經驗和工作態度,質檢效果波動大、效率低。生產商一方面需要基于其他生產商的全量樣本數據進行模型訓練,但另一方面不希望將零件數據本身的信息透露給其他生產商。因此,亟需建立一種原始數據不出本地、基于跨企業數據共享的分析挖掘方式。
在分布式認知工業互聯網中,采用基于安全多方計算的數據流通架構,利用服務平臺功能將流水線每個環節采集到的問題工件圖片,通過安全多方計算進行共享。計算節點使用共享數據集進行機器學習聯合訓練,生成并使用問題工件預測模型,給企業進行全量自動化質檢。平臺主要實現多方安全計算、區塊鏈存證、數據傳輸以及供需對接功能,從而實現數據可用不可見、可控可計量、模塊化與易開發,在保障數據安全的前提下,提高了計算的性能與數據的價值。參與實施的供應商各自提供帶有劃痕和缺陷的工件圖片,通過數據共享進行聯合模型訓練(如圖3所示),可以大幅提升模型準確率。
圖3 自動化質檢與可信協作模型
3.2 工業互聯網網絡安全防護
大部分傳統工業企業依靠物理方式實現廠內數據、網絡與外界的隔離,工業互聯網的出現打破了其物理隔離屏障,但同時也使互聯網中存在的一些安全威脅蔓延到了工業網絡,需要加快工業互聯網網絡安全防護體系的升級與變革。在分布式認知工業互聯網中,通過隱私計算技術可以實現設備、數據、網絡等要素的安全訪問和操作控制。
工業環境設備、網關設備、云基礎設施等設備之間的身份識別與認證是實現工業互聯網網絡安全防護的基礎,分布式認知工業互聯網中采用零信任、主動式網絡安全防護理念,任何網絡訪問都需要基于身份認證,需要對訪問主體的風險和信任度進行持續評估,動態授予訪問權限。通過消息認證、數字簽名等基礎密碼學輔助隱私計算技術,可以防止身份隱私數據外泄,實現相關設備之間的可信認證。結合區塊鏈技術中的共識機制、智能合約以及隱私計算技術數據可用不可見的特點,設計工業數據的管理規則、存儲規則以及交易規則,根據工業數據敏感度采用分等級(一般數據不加密、重要數據部分加密、敏感數據完全加密等)的加密存儲措施,為數據安全提供可行、高效、低成本的防護方案。此外,通過部署誘騙系統,吸引攻擊者并記錄攻擊行為,通過隱私計算中的聯邦學習模型分析新型攻擊的特點。在此基礎上,建立聯動機制使防火墻、入侵檢測系統、反病毒系統、日志處理系統等安全技術和產品協同工作、聯動運轉,跟蹤回溯攻擊源,學習新的入侵規則并反哺安全防護體系。
3.3 工業隱私數據全生命周期保護
工業隱私數據全生命周期分為工業數據采集、工業數據存儲、工業數據流轉、工業數據利用與工業數據追溯五個階段。在數據采集階段,采用搭載可信芯片的物聯網設備為終端對真實數據進行實時采集,利用同態加密、數據脫敏、差分隱私等隱私計算技術保障數據安全并將密文上鏈存儲。在數據存儲階段,利用區塊鏈的分布式存儲技術形成不可篡改的數據記錄,有效防止單點攻擊,避免攻擊者獲取完整的隱私數據,保障數據存儲安全。在數據流轉階段,工業數據提供方為工業數據、工業加密數據、計算因子以及部分運算結果的提供方。工業數據使用方為工業數據或運算結果的需求方,需求參數的提供方。隨著數據提供方和使用方數量增多,以及雙方對數據的使用形式和深度提出的不同需求,在分布式認知工業互聯網架構的基礎上,結合隱私計算技術,可以打造更為安全的工業數據流轉模式,多家企業可以使用多方安全計算,共享工業數據樣本,共同訓練神經網絡模型(如圖4所示)。除了安全多方計算,數據沙盒和聯邦學習也是常見的數據流轉方式。隱私計算技術使得工業數據的共享與流通在連接性、可信度以及應用深度上均有提高。在數據利用階段,根據工業數據使用方的不同計算需求搭建聯邦學習或可信計算平臺,各參與方共建工業數據虛擬模型,數據本身無需移動即可實現多方數據的高效利用及訓練,在保障數據隱私的前提下不斷挖掘其價值。在數據追溯階段,結合區塊鏈及隱私計算技術,對交易、設備、產品等信息實現可信、難以篡改的溯源查詢。
圖4 工業隱私數據安全流轉模型
4 隱私計算面臨的挑戰與展望
隱私計算發展至今分化出了多種技術路線,多種隱私計算框架并存且短期內無法得到統一,在性能、安全性等方面都各有側重。例如,基于密碼學算法的隱私計算技術依賴于嚴格的密碼理論,計算性能受到密碼學算法的制約;融合聯合建模的隱私計算技術存在各參與方計算性能不一致的問題,同時對網絡連接狀態及網絡帶寬有較強的依賴,計算效率受到網絡狀態的制約;基于可信硬件的隱私計算技術需要較高的硬件投入,隱私保護能力受到硬件廠商可信度的制約。因此在實際使用過程中,需要針對不同的工業互聯網應用場景具體設計,綜合考慮性能、安全性、可擴展性、成本等多方面因素來選用合適的隱私計算技術類別,也要考慮所選技術類別與其他技術(如區塊鏈、知識圖譜、邊緣計算等)的融合運用難度,盡量選擇具有更高可信度和安全性的機構作為主要參與方,并提前考慮其他參與方進行惡意攻擊造成的影響和應對措施。
5 結束語
隱私計算技術的優點使其近年來受到了各個領域的持續關注,在工業互聯網領域也成為了工業數據難以安全共享問題的重點解決方案。本文在工業互聯網核心功能的基礎上,重點闡述了分布式認知工業互聯網功能架構,聚焦區塊鏈、隱私計算等技術,結合工業互聯網領域的業務特點,提出了包括工業產品自動化質檢與可信協作、工業互聯網網絡安全防護、工業隱私數據全生命周期保護在內的三大應用場景,并分析了隱私計算尚存的挑戰與展望。隱私計算在滿足國家法律法規及相關政策的前提下可以實現多方數據價值的最大化,在各種工業互聯網細分應用場景中將會發揮更加重要的作用。
本文刊于《信息通信技術與政策》2023年 第11期
審核編輯:湯梓紅
-
通信技術
+關注
關注
20文章
1131瀏覽量
92254 -
物聯網
+關注
關注
2909文章
44635瀏覽量
373397 -
大數據
+關注
關注
64文章
8889瀏覽量
137445 -
工業互聯網
+關注
關注
28文章
4322瀏覽量
94118
原文標題:專題丨隱私計算在分布式認知工業互聯網中的應用研究
文章出處:【微信號:AII_20160201,微信公眾號:工業互聯網產業聯盟】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論