物聯網 (IoT) 的目標是從各種嵌入式系統中獲取數據,并對這些數據進行分析處理,以提高性能、效率和業務成果。在設計分析驅動的嵌入式系統的三部分系列的第一部分中,回顧了物聯網數據采集和預處理的最佳實踐。
分析驅動的嵌入式系統就在這里。創建處理大量業務和工程數據的分析的能力使許多行業的設計師能夠開發智能產品和服務。設計人員可以使用分析來描述和預測系統的行為,并進一步將分析與嵌入式控制系統相結合,以實現行動和決策的自動化。
在一些實施方式中,分析在云中執行以提高嵌入式系統性能。Borislav Savkovic 是一名受過培訓的控制系統工程師,他在BuildingIQ領導了一個團隊設計一個使用分析來降低能耗的建筑氣候控制系統。該系統以千兆字節的工程和業務數據開始。工程數據來自功率計、溫度計、壓力傳感器和其他 HVAC 傳感器。業務數據來自天氣預報、實時能源價格和需求響應數據。在分析驅動的系統中,該團隊使用信號處理來消除噪聲,使用機器學習來檢測尖峰,使用控制理論來解釋加熱和冷卻動態,并使用數百個參數進行多目標優化。BuildingIQ 云服務中運行的分析可調整建筑物的 HVAC 嵌入式系統。結果:分析驅動的系統可將商業建筑的能耗降低多達 25%。
在其他情況下,分析直接在嵌入式系統本身中運行。瑞典卡車制造商斯堪尼亞的設計團隊將分析嵌入到他們的緊急制動系統中,以提供實時碰撞避免,以減少事故并滿足嚴格的歐盟法規。來自攝像頭和雷達的工程數據被實時處理以進行物體檢測和道路標記檢測,隨后融合以發出碰撞警告警報和自動制動請求。通過詳盡的測試和驗證來確保系統的安全性和可靠性,包括測試場景創建、使用模擬和記錄數據進行系統建模以及硬件在環 (HIL) 測試。
這兩個示例突出了設計人員在開發分析驅動系統時使用的步驟:
預處理/處理海量數據
開發分析算法
實時運行分析和控制
將分析與傳感器和嵌入式設備以及可能的其他非嵌入式資源(例如 IT 系統和云)集成
我們將在本部分中介紹預處理,以及第二部分和第三部分中的其余步驟。
訪問數據
開發分析的第一步是訪問大量可用數據以探索模式并獲得更深入的見解。數據集不僅規模大,而且可以來自許多不同的來源并代表許多不同的屬性。因此,您用于探索性分析和分析開發的軟件工具應該能夠訪問您計劃使用的所有數據源和格式。文件類型可能包括文本、電子表格、圖像、音頻、視頻、地理空間、Web 和 XML。您可能還需要特定于應用程序的數據格式,例如用于科學數據的通用數據格式 (CDF) 或分層數據格式 (HDF),以及用于汽車數據的 CAN。您還應該能夠從存儲點和生成點訪問數據,例如:
存儲數據:數據庫、數據倉庫、分布式文件系統和 Hadoop 大數據系統
設備數據:例如存儲在分布式控制系統 (DCS)、監控和數據采集系統 (SCADA) 和可編程邏輯控制器 (PLC) 中的實時和歷史工廠數據
物聯網設備:包括傳感器、本地集線器或云數據聚合器
預處理數據
一個關鍵步驟是在開發預測模型之前進行數據清理和準備。例如,數據可能有缺失或錯誤的值,或者可能使用不同的時間戳格式。來自錯誤數據的預測可能難以調試,或者更糟的是,可能導致影響系統性能和可靠性的不準確或誤導性預測。常見的預處理任務包括:
清理有錯誤、異常值或重復的數據
通過丟棄、過濾或插補處理缺失數據
使用先進的信號處理技術從傳感器數據中去除噪聲
使用不同的采樣率合并和時間對齊數據
預處理的另一個重要部分是數據轉換和歸約。這里的目標是找到數據中最具預測性的特征,并過濾不會增強分析模型預測能力的數據。一些常見的技術包括:
特征選擇以減少高維數據
用于降維的特征提取和變換
信號、圖像和視頻處理等領域分析
越來越需要在傳感器或嵌入式設備本身上進行更多的數據預處理和還原。造成這種情況的原因有很多,但最突出的兩個要求是低功率和速度。許多智能設備需要在不充電的情況下長時間運行。最昂貴的電力消耗之一是使用無線通信將數據發送到服務器或云分析引擎。由于流式傳輸所有原始傳感器數據的成本可能高得令人望而卻步,因此良好的系統設計應該進行本地預處理,并且只上傳有用信息或預測信號本身。速度通常是最重要的,因為任何實時系統的價值都是互連系統提供的及時響應。
BuildingIQ 和 Scania 是捕獲和預處理工程數據并將其與傳統業務數據相結合以開發分析驅動系統的挑戰和成功方法的好例子。
在這三部分系列的第二部分中,我們將介紹高級分析算法,例如機器學習和深度學習,并展示軟件工具如何使領域專家能夠實時開發和運行分析和規范控制。
審核編輯:郭婷
-
傳感器
+關注
關注
2552文章
51302瀏覽量
755256 -
嵌入式
+關注
關注
5088文章
19158瀏覽量
306496
發布評論請先 登錄
相關推薦
評論