大數據時代,數據已經滲透到各個行業和業務職能領域,成為重要的生產因素。但對于企業而言,只有數據是遠遠不夠的,企業還需要學會從海量的數據(Data)中提取有用的信息(Information),隨后轉變為能為己用的知識(Knowledge),最終做出智慧(Wisdom)的決策。
數據分析的流程
面對旺盛且復雜的數據分析需求,企業可以借助 PPDAC 閉環體系對數據進行高效的分析。
首先,PPDAC閉環尋找出企業生產中存在的痛點問題(Problem)
隨后針對痛點問題制定生產數據計劃(Plan)
緊接著采集、整理與痛點問題相關的數據(Data)
之后對這些數據進行相關層次的分析(Analysis)
最后根據分析結果得出結論(Conclusion)
這些結論能為企業提供有效解決痛點問題的解決方案。
在數據分析過程中,根據程度的不同,可分為四個分析階段:描述性分析、診斷性分析、預測性分析和規范性分析。這四個階段的難度與分析所獲得的價值都是逐次遞增的,并且每個階段采用的技術手段也不盡相同。本文重點介紹描述性分析與預測性分析的過程。
獲取數據
首先,企業要明確生產過程中的痛點問題,制定相應的計劃,而后再進行相關數據的采集工作。數據存在于工業企業的各個層級之中,擁有各種表現形式。例如,通過 CIP、Profibus 等各種通訊協議在總線中流動的實時數據;存儲在文件、數據庫、歷史數據庫等軟件中的歷史數據;通過 MQTT, HTTP 等協議傳輸的物聯網信息;還有通過 REST API 從云端傳來的信息等。
不同層級的信息特點各不相同:越往底層,通訊頻率越快,節點越多,對時效性的要求越高;越往高層,通訊信息量越大,對時效性要求則相對低一些。
為了從大范圍的場景獲取所有的數據,數據獲取軟件需要具備以下強大功能:
支持眾多協議,包括傳統的封閉工業協議到互聯網流行的 REST API 協議
高效率的通訊,能夠過濾采樣,減少重復信息
高性能的通訊,能夠支持眾多節點,以及較大的通訊量
高安全性的通訊,能夠支持權限、認證管理、加密傳輸以應對越發猖獗的網絡攻擊
高可靠性的通訊,能夠應對各種網絡波動及故障的考驗
完成相關的數據采集后,需要對數據進行整理、清洗、加工等,以備下一步分析
描述性分析
在獲取足夠的數據之后,企業就可進入不同層級的數據分析階段,其中以描述性分析為基礎。描述性分析旨在了解數據“已經發生了什么”,主要是通過計算數據的基本統計特征值,例如,最大值、最小值、方差、標準差、中位數、頻數等,來了解已有數據的集中趨勢、分布情況及離散程度等信息。
此外,描述性分析作為企業最常用的數據分析手段,能夠快速指出要查找的內容,預先定義計算模式,而后通過現在或者歷史數據進行計算,最后可用報表或儀表盤視圖將分析結果呈現出來,大大節省數據分析時間。下方展示的設備綜合效率(OEE)就是如此。
預測性分析
正如前文提到,描述性分析主要對數據的過去進行總結,而預測性分析則需了解“將來會發生什么”。它將歷史數據與統計建模、數據挖掘技術和機器學習相結合,找出數據之間存在的關系,并基于數據對未來的設備情況通過建立模型進行預測。這樣能夠幫助管理人員預測將來可能會發生的情況,進而提前計劃及決策,而非被動地只能針對已經發生的事件作出回應。
在預測性分析中,企業需要運用機器學習算法進行建模預測,其中算法的種類多樣,常用的基本算法包括決策樹、線性回歸、K 均值、樸素貝葉斯等,此外還有諸如神經網絡之類的高級算法。想要徹底地理解這些算法并不容易,需要豐富的數學、概率論等交叉學科的知識。好在目前研究成熟,我們只需模塊化地使用即可。
以監督學習為例,利用機器學習進行預測性分析時,其使用流程與工業傳統的PID算法流程大致相同,具體步驟如下:
第一步,選擇數據
從歷史數據中找出相關數據,并且標識出其中的特征值與輸出
第二步,選擇模型
依據待處理的問題選擇合適的回歸或分類算法
第三步,調試優化
使用80%的數據對模型進行訓練,隨后利用剩下20%的數據對模型進行測試,觀察預測的準確率是否達到預期。如果準確率不夠,則調整相關參數,再次進行測試
第四步,部署
將考核通過的模型部署到系統中,接收新的數據,輸出預測結果
數據可視化
在數據分析后,數據可視化成為企業快速解決痛點問題的關鍵所在。用于數據可視化的圖形多種多樣(如下圖所示),只要選擇合適的圖形來展示合適的數據就可以起到事半功倍的效果。例如:用餅狀圖展示不同數據的占比情況;用散點圖展示數據的分布情況及相關性(Correlation),再用曲線擬合,做一些簡單的預測;用表格展示匯總信息;用氣泡圖展示三個變量之間的關系等,在工業行業中,由于諸多數據是時間序列數據(Time series data),因此選用折線圖(Line chart)進行展示,便能夠高效地了解數據的趨勢(Trend)。總而言之,對于不同的數據,選擇最佳的展現方式能夠讓數據可視化發揮出最優效果。
但是,僅僅從一個視角對數據進行觀察是遠遠不夠的,為了能夠更加全面地了解數據情況,我們需要將多個視角產生的圖表整合在同一個數據展板上。同時,對數據進行不同層次的展示也是必不可少的,數據鉆取就能很好地完成這項任務,它能夠針對不同層級、結構或條件對數據進行細分呈現,讓用戶得以縮小數據范圍,逐步下鉆并聚焦到小點上,為用戶節省更多時間與精力,同時優化數據可視性的效果。
羅克韋爾自動化 FactoryTalk Analytics
羅克韋爾自動化 FactoryTalk Analytics 為工業制造從業人員提供了從描述性分析到規范性分析的完整解決方案,能夠改善整體設備效率 (OEE) 、減少停機時間,以及改善質量或流程。
FactoryTalk Analytics 具體功能如下:
可以使用 FactoryTalk Edge Gateway 從工業企業的各個環節將數據引入
可以借助 FactoryTalk Analytics DataView 和 FactoryTalk Metrics 對數據進行描述性分析、整體設備效率 (OEE) 及可視化展示
可以依靠 FactoryTalk Analytics LogixAI、FactoryTalk Analytics Edge ML 、Pavilion8 在企業的不同層面對數據進行預測性分析
FactoryTalk Analytics 現可為流程工程師、數據科學家等提供全面且簡潔的數據分析技術,使數據分析準備工作量減少70% 。FactoryTalk Analytics 還可與 InnovationSuite 增強現實和制造執行系統 (MES) 解決方案無縫集成,將切實可行的見解帶至車間,優化企業級供應鏈運作。
小羅有話說
大數據之于企業而言,既是機遇,也是挑戰。羅克韋爾自動化憑借先進的自動化、數字化和智能化技術,為客戶提供以數據分析為主線的全方位數字解決方案,幫助企業解決數據分析、可視化等難題,讓數據會“說話”,進一步為企業節省決策時間,贏得獨特競爭優勢,逐步實現從節流、開源到顛覆的價值突破。
-
數據分析
+關注
關注
2文章
1449瀏覽量
34059 -
羅克韋爾
+關注
關注
2文章
189瀏覽量
14958 -
工業制造
+關注
關注
0文章
404瀏覽量
28062
原文標題:羅家“秘籍”:讓你的“數據”會說話
文章出處:【微信號:羅克韋爾自動化,微信公眾號:羅克韋爾自動化】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論