在網(wǎng)上查了查,關(guān)于互聯(lián)網(wǎng)數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)分析的文章比較多,但是關(guān)于物聯(lián)網(wǎng)數(shù)據(jù)分析的文章幾乎找不到,于是萌發(fā)了寫一篇專門講解物聯(lián)網(wǎng)數(shù)據(jù)分析的文章,作為自己工作經(jīng)驗(yàn)及方法論的復(fù)盤,同時(shí)也期望能夠?qū)Ω魑煌兴鶈l(fā)。
物聯(lián)網(wǎng)服務(wù)究竟是如何運(yùn)轉(zhuǎn)的?包含哪些要素?每個(gè)部分起什么作用?如何運(yùn)轉(zhuǎn)?有哪些關(guān)鍵技術(shù)或者技能?
從傳感器->設(shè)備->網(wǎng)關(guān)->服務(wù)器,整個(gè)路徑能夠很好地實(shí)現(xiàn)將數(shù)據(jù)采集到物聯(lián)網(wǎng)平臺(tái),但是為什么要對(duì)這些數(shù)據(jù)做分析,如何應(yīng)用這些數(shù)據(jù),如何做好數(shù)據(jù)分析呢?
一、什么是物聯(lián)網(wǎng)數(shù)據(jù)
基于我們對(duì)于物聯(lián)網(wǎng)服務(wù)構(gòu)建的基礎(chǔ)我們可以知道:物聯(lián)網(wǎng)數(shù)據(jù)數(shù)據(jù)主要是指?jìng)鞲衅骱驮O(shè)備發(fā)過(guò)來(lái)的數(shù)據(jù)。這些數(shù)據(jù)一部分是對(duì)現(xiàn)實(shí)環(huán)境參數(shù)的采集值,一部分是設(shè)備的一些常規(guī)信息值,比如:狀態(tài)、故障信息、錯(cuò)誤代碼、運(yùn)行情況等。
物聯(lián)網(wǎng)數(shù)據(jù)在任何情況下都會(huì)產(chǎn)生數(shù)據(jù),無(wú)需人為參與就不會(huì)不斷涌現(xiàn)出新的數(shù)據(jù),其數(shù)據(jù)量遠(yuǎn)遠(yuǎn)大于傳統(tǒng)業(yè)務(wù)系統(tǒng)的業(yè)務(wù)數(shù)據(jù)。
1. 物聯(lián)網(wǎng)數(shù)據(jù)分類
如果單純的按照數(shù)據(jù)變化來(lái)對(duì)物聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行分類,我們可以分為:靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)。
1)靜態(tài)數(shù)據(jù)
指?jìng)鞲衅骰蛘咴O(shè)備的一些屬性性質(zhì)的數(shù)據(jù),不增加新設(shè)備的情況下,不伴隨時(shí)間的變化而變化,也不會(huì)隨著時(shí)間的增長(zhǎng)而增長(zhǎng)。
代表性的數(shù)據(jù)是設(shè)備ID、設(shè)備地址等,這種數(shù)據(jù)采用結(jié)構(gòu)型、關(guān)系型數(shù)據(jù)庫(kù)存儲(chǔ)。
2)動(dòng)態(tài)數(shù)據(jù)
指隨著時(shí)間周期會(huì)發(fā)生變化的數(shù)據(jù),每個(gè)數(shù)據(jù)都與時(shí)間值有對(duì)應(yīng)關(guān)系——數(shù)據(jù)采用時(shí)序方式進(jìn)行存儲(chǔ),數(shù)據(jù)量非常大;并且采集越頻繁數(shù)據(jù)量越大,數(shù)據(jù)不僅僅會(huì)隨著設(shè)備數(shù)量增加而增加,還會(huì)隨著時(shí)間增加而增加。
這樣的數(shù)據(jù)通常情況下,我們會(huì)按照一定的時(shí)間進(jìn)行刪除,否則數(shù)據(jù)量會(huì)過(guò)大。
根據(jù)一些行業(yè)的要求,通常情況下保存的年限設(shè)置在3~5年。具體的沒(méi)有明確要求,關(guān)鍵是看自己所處行業(yè)的要求進(jìn)行自行設(shè)定。
2. 為什么要做物聯(lián)網(wǎng)數(shù)據(jù)分析
如果物聯(lián)網(wǎng)只是負(fù)責(zé)采集一堆傳感器和設(shè)備發(fā)過(guò)來(lái)的數(shù)據(jù),那就只不過(guò)是一堆龐大的數(shù)據(jù)聚集在一起,產(chǎn)生不了實(shí)際的價(jià)值意義。
然而,在實(shí)際實(shí)踐中我們可以發(fā)現(xiàn):物聯(lián)網(wǎng)數(shù)據(jù)非常有意思。
經(jīng)過(guò)分析,我們可以利用傳感器或者設(shè)備數(shù)據(jù),清楚的知道設(shè)備的運(yùn)行情況以及現(xiàn)實(shí)環(huán)境運(yùn)營(yíng)的趨勢(shì),幫助作出預(yù)判和提前作出響應(yīng)。
比如:利用物聯(lián)網(wǎng)的數(shù)據(jù)可以有效預(yù)判機(jī)械的故障,減少因?yàn)樵O(shè)備故障而帶來(lái)的工作耽誤。
根據(jù)設(shè)備上傳的設(shè)備狀態(tài)信息值的變化,以及特定傳感器采集的參數(shù),就可以監(jiān)測(cè)預(yù)判發(fā)生故障的概率,同時(shí)提前做出響應(yīng)。
——這樣就能夠把一個(gè)物聯(lián)網(wǎng)服務(wù)從一個(gè)單純的數(shù)據(jù)采集,上升到一個(gè)能夠不斷創(chuàng)造附加值的服務(wù)層面。
同時(shí),基于采集的數(shù)據(jù)的分析的運(yùn)營(yíng),還可以重新構(gòu)建企業(yè)新的運(yùn)營(yíng)模式。
整體來(lái)說(shuō):物聯(lián)網(wǎng)數(shù)據(jù)分析在新形式下的應(yīng)用將會(huì)極大助力企業(yè)轉(zhuǎn)型升級(jí)。
3. 物聯(lián)網(wǎng)數(shù)據(jù)能做哪些方面的應(yīng)用
物聯(lián)網(wǎng)數(shù)據(jù)能夠幫助我們做哪些方面的應(yīng)用呢,總結(jié)下來(lái)可能主要有以下幾個(gè):
監(jiān)控:將物聯(lián)網(wǎng)數(shù)據(jù)直接可視化展示,就可以實(shí)現(xiàn)設(shè)備的狀態(tài)監(jiān)控,及時(shí)知道什么發(fā)生了什么。
反控:當(dāng)監(jiān)測(cè)到異常數(shù)據(jù)需要干預(yù)時(shí),可以直接通知對(duì)應(yīng)的管理員,遠(yuǎn)程操控設(shè)備實(shí)現(xiàn)反控,提高操作效率,避免直接到設(shè)備現(xiàn)場(chǎng)。
報(bào)表統(tǒng)計(jì):基于物聯(lián)網(wǎng)數(shù)據(jù),我們可以根據(jù)實(shí)際的需求,對(duì)相關(guān)的歷史數(shù)據(jù)做報(bào)表統(tǒng)計(jì)分析,按照不同的維度以圖表或者圖形的形式呈現(xiàn)給不同類型的用戶,幫助他們快速直觀知道設(shè)備的運(yùn)行情況。
預(yù)測(cè)/預(yù)判:基于數(shù)據(jù)分析模型,可以對(duì)一些事件做預(yù)判,提前獲取概率性,以便及時(shí)作出響應(yīng),避免造成更大的損失,或者直接獲取其他收益。
人工智能:當(dāng)數(shù)據(jù)及經(jīng)驗(yàn)積累到一定程度,系統(tǒng)可以自動(dòng)針對(duì)事件數(shù)據(jù)分析后,作出正確的響應(yīng),無(wú)需人工干預(yù)。
基于此呢,我們基本上算是給大家說(shuō)了一個(gè)基礎(chǔ)的鋪墊了。那么接下來(lái),我們就要本次分享的重點(diǎn)了,我們來(lái)看:如何進(jìn)行物聯(lián)網(wǎng)數(shù)據(jù)分析,有哪些方法論,具體怎么實(shí)操呢?
二、數(shù)據(jù)分析準(zhǔn)備工作
如果把數(shù)據(jù)分析比作炒菜,那么我們首先得準(zhǔn)備一些原材料;那么對(duì)于數(shù)據(jù)分析,我們應(yīng)該做哪些準(zhǔn)備工作呢?
1. 數(shù)據(jù)采集
數(shù)據(jù)采集顧名思義就是采集我們需要用來(lái)做分析的數(shù)據(jù),同時(shí)將這些數(shù)據(jù)以特定格式保存下來(lái)。
通常情況下,數(shù)據(jù)分析會(huì)基于歷史累計(jì)下來(lái)的數(shù)據(jù),如果數(shù)量大,可以使用一些大數(shù)據(jù)工具進(jìn)行處理——比如常用的Hadoop等。
數(shù)據(jù)采集的方式及過(guò)程,我們就不多說(shuō)了,直接參照之前的文章,基本上就可以知道數(shù)據(jù)采集的流程及處理的過(guò)程。
2. 數(shù)據(jù)積累
數(shù)據(jù)積累就是將有用的數(shù)據(jù)保存下來(lái),方便管理和提取。
數(shù)據(jù)積累會(huì)用到數(shù)據(jù)庫(kù),這個(gè)在我們很多文章中都有提及;不僅僅是結(jié)構(gòu)化數(shù)據(jù)的關(guān)系型數(shù)據(jù)庫(kù),還有鍵值存儲(chǔ)數(shù)據(jù)庫(kù)等。
3. 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理就是對(duì)數(shù)據(jù)進(jìn)行加工,剔除沒(méi)有用的或者異常的數(shù)據(jù),提取有用的部分的信息,對(duì)數(shù)值進(jìn)行處理等等。對(duì)數(shù)據(jù)進(jìn)行必要的處理,形成匯集分析用的數(shù)據(jù)集,就是數(shù)據(jù)預(yù)處理的目的。
三、數(shù)據(jù)分析方法
基于數(shù)據(jù)應(yīng)用的用途考慮,我們將數(shù)據(jù)分析方法姑且分為統(tǒng)計(jì)分析法和機(jī)器學(xué)習(xí)法。
其中統(tǒng)計(jì)分析法主要是依靠分析師手工進(jìn)行分析,基于一定的目的提取數(shù)據(jù),并進(jìn)以各種形式進(jìn)行展示。
機(jī)器學(xué)習(xí)法呢,就是說(shuō)的比較多的人工智能,主要依據(jù)對(duì)以往數(shù)據(jù)的學(xué)習(xí),來(lái)推斷未知的數(shù)據(jù)或者狀態(tài)。
1. 統(tǒng)計(jì)分析法
統(tǒng)計(jì)分析其實(shí)還真沒(méi)太多的需要說(shuō)的,就是基于統(tǒng)計(jì)結(jié)果做呈現(xiàn),用各種形式表示出來(lái),達(dá)到直觀呈現(xiàn)的目的。
如果按照步驟來(lái)講,那么主要是以下幾個(gè)步驟:
Step1:決定你的信息
根據(jù)你手里面的數(shù)據(jù),明確你想要的表達(dá)的具體信息是什么;
Step2:確定相對(duì)關(guān)系
你確定的信息在一定程度上講主要包括5種基本類別中的一種,成分、項(xiàng)目、時(shí)間順序、頻率分析及相關(guān)性;
Step3:選擇圖表形式
每一種相對(duì)關(guān)系都可以引導(dǎo)出相對(duì)應(yīng)的圖表形式,常見(jiàn)的圖表形式包含:餅圖、條形圖、柱形圖、折線圖、散點(diǎn)圖,當(dāng)然不是特別完整哈,我們只是列舉。
下面我們來(lái)舉一個(gè)例子,說(shuō)明一下具體的使用:
比如家里面的智能燃?xì)獗聿杉擞脷獾臄?shù)據(jù),那么我們就可以用圖形表示一定時(shí)間內(nèi)用氣量的變化,從而直觀的掌握用氣數(shù)據(jù)的變化趨勢(shì)。
2. 機(jī)器學(xué)習(xí)法
機(jī)器學(xué)習(xí)主要是指:基于大量數(shù)據(jù)來(lái)學(xué)習(xí)數(shù)據(jù)的傾向,從而做出某些判斷并執(zhí)行對(duì)應(yīng)的“動(dòng)作”。
機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘是同根同生,二者都是基于數(shù)據(jù)進(jìn)行某些推測(cè)和判斷。統(tǒng)計(jì)分析法是是對(duì)采集數(shù)據(jù)進(jìn)行呈現(xiàn),數(shù)據(jù)被視為無(wú)機(jī)的數(shù)值,屬于表層的數(shù)據(jù)分析。
機(jī)器學(xué)習(xí)分析法主要是從數(shù)據(jù)中提取更復(fù)雜的傾向、規(guī)則、結(jié)構(gòu)等信息,采用數(shù)學(xué)公式和規(guī)律模型來(lái)表現(xiàn)傾向。
說(shuō)機(jī)器學(xué)習(xí)法之前,我們首先來(lái)說(shuō)一下數(shù)據(jù)學(xué)習(xí)的類型,我們分為“規(guī)則學(xué)習(xí)”和“非規(guī)則學(xué)習(xí)”兩個(gè)類別。
規(guī)則學(xué)習(xí)主要是指數(shù)據(jù)的答案是明確的,機(jī)器只需要將新的數(shù)據(jù)與正確答案進(jìn)行比較即可做出判斷;非規(guī)則學(xué)習(xí)則沒(méi)有既定的正確的答案,需要根據(jù)數(shù)據(jù)的整體傾向然后找出異常值。
舉個(gè)例子:我們將某一設(shè)備的故障值范圍設(shè)定為12~28,直接基于這個(gè)范圍就叫規(guī)則學(xué)習(xí)。而如果沒(méi)有范圍,那么就需要采用一定的算法讓機(jī)器區(qū)分?jǐn)?shù)據(jù)傾向,并且正確調(diào)出異常值了。
下面我們直接舉幾個(gè)例子,透過(guò)例子來(lái)理解應(yīng)該來(lái)講是更加直接的:
命題一:通過(guò)傳感器采集到的數(shù)據(jù),判斷機(jī)器故障的原因
對(duì)于這類問(wèn)題,需要先定義清楚數(shù)據(jù)時(shí)非故障機(jī)器的還是故障機(jī)器的,然后再通過(guò)對(duì)比數(shù)據(jù)差異化找出因果關(guān)系最后形成判斷依據(jù),讓機(jī)器具備判斷能力。
命題二:通過(guò)各種因素因素來(lái)預(yù)測(cè)交通量
說(shuō)到預(yù)測(cè)分析,那么對(duì)于交通量的預(yù)測(cè)無(wú)疑是比較有意思的,通過(guò)傳感器在一定的持續(xù)時(shí)間范圍內(nèi)對(duì)某條道路的交通量進(jìn)行采集。
然后,再通過(guò)星期數(shù)、天氣、時(shí)間段等因素的綜合分析計(jì)算,那么就可以形成一套計(jì)算方法,并且在某一段時(shí)間內(nèi)運(yùn)用計(jì)算值與實(shí)際值進(jìn)行對(duì)比,不斷修正算法,就能夠較為精準(zhǔn)的預(yù)算某一天的交流通量,比如:交通量=a*星期數(shù)+b*天氣情況+c+……
四、總結(jié)
關(guān)于物聯(lián)網(wǎng)數(shù)據(jù)分析,其實(shí)是與互聯(lián)網(wǎng)數(shù)據(jù)分析有些相似的基礎(chǔ)知識(shí)的,所以我們沒(méi)講那么多。
分析是基礎(chǔ),對(duì)于數(shù)據(jù)的應(yīng)用的才是關(guān)鍵。具體對(duì)數(shù)據(jù)咋個(gè)應(yīng)用,需要對(duì)行業(yè)和客戶有較為深刻的理解,那么就需要我們產(chǎn)品經(jīng)理戶或者數(shù)據(jù)分析師對(duì)行業(yè)及業(yè)務(wù)非常的了解,然后再根據(jù)物聯(lián)網(wǎng)數(shù)據(jù)特性制定相關(guān)方案,解決實(shí)際的問(wèn)題。
-
物聯(lián)網(wǎng)
+關(guān)注
關(guān)注
2911文章
44824瀏覽量
375121 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1455瀏覽量
34090
原文標(biāo)題:對(duì)物聯(lián)網(wǎng)行業(yè)而言,數(shù)據(jù)分析具體怎么做?
文章出處:【微信號(hào):IndustryIOT,微信公眾號(hào):工業(yè)互聯(lián)網(wǎng)前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論