當(dāng)今的IoT用例越來(lái)越依賴于對(duì)大量設(shè)備生成的數(shù)據(jù)進(jìn)行分析或?qū)崟r(shí)更新機(jī)器學(xué)習(xí)算法。如果沒(méi)有實(shí)時(shí)獲取、處理和采取行動(dòng),以監(jiān)控患者、自動(dòng)駕駛汽車或預(yù)測(cè)性維護(hù)應(yīng)用的數(shù)據(jù),則患者會(huì)遭受傷害,車輛墜毀或系統(tǒng)出現(xiàn)故障。
那么,企業(yè)如何才能經(jīng)濟(jì)高效地構(gòu)建一個(gè)可靠的平臺(tái)來(lái)大規(guī)模接收和響應(yīng)大量數(shù)據(jù)?企業(yè)可以使用基于開放源代碼軟件堆棧構(gòu)建的流平臺(tái)和數(shù)據(jù)存儲(chǔ)系統(tǒng)來(lái)做到這一點(diǎn)。
事實(shí)證明,當(dāng)今許多開源解決方案在數(shù)千個(gè)生產(chǎn)部署中都是可靠的。許多產(chǎn)品都可從商業(yè)企業(yè)獲得企業(yè)級(jí)支持和咨詢服務(wù),這也可能會(huì)提供企業(yè)級(jí)版本的解決方案。這些受支持的解決方案使企業(yè)可以通過(guò)實(shí)施IoT解決方案來(lái)實(shí)現(xiàn)其數(shù)字化轉(zhuǎn)型目標(biāo),而無(wú)需支付大量的前期費(fèi)用,同時(shí)還為其公司提供可靠的、面向未來(lái)的基礎(chǔ)設(shè)施。
以下是開放源代碼解決方案的樣本,這些解決方案是當(dāng)今許多最成功的數(shù)字化轉(zhuǎn)型企業(yè)的基礎(chǔ)。
流數(shù)據(jù)
諸如Apache Kafka或Apache Flink之類的開源流解決方案用于構(gòu)建實(shí)時(shí)數(shù)據(jù)管道,以在IoT部署中的系統(tǒng)和應(yīng)用之間移動(dòng)數(shù)據(jù)。例如,在患者監(jiān)控用例中,流傳輸解決方案會(huì)將由連接到患者的IoT傳感器收集的數(shù)據(jù)傳遞到平臺(tái),在平臺(tái)上可以對(duì)數(shù)據(jù)進(jìn)行匯總、分析和存儲(chǔ)。
Box、LinkedIn、Netflix、Oracle和Twitter使用Kafka。Flink在阿里巴巴、AWS、Capital One、eBay和Lyft的運(yùn)營(yíng)中使用。但是,要使流傳輸解決方案大規(guī)模支持實(shí)時(shí)業(yè)務(wù)流程,必須將其與其他技術(shù)集成,包括分布式內(nèi)存計(jì)算平臺(tái)、容器管理解決方案以及分析和機(jī)器學(xué)習(xí)功能。
內(nèi)存計(jì)算
Apache Ignite是部署在商品服務(wù)器群集上的分布式內(nèi)存計(jì)算平臺(tái)。它可用作插入現(xiàn)有應(yīng)用程序和基于磁盤的數(shù)據(jù)庫(kù)之間的內(nèi)存數(shù)據(jù)網(wǎng)格,也可用作新應(yīng)用程序的獨(dú)立內(nèi)存數(shù)據(jù)庫(kù)。 Ignite池化了群集的可用CPU和RAM,并將數(shù)據(jù)和計(jì)算分配到各個(gè)節(jié)點(diǎn)。它可以部署在本地、公共或私有云中或混合環(huán)境中。Ignite支持ANSI-99 SQL和ACID事務(wù)。
Ignite可以實(shí)時(shí)攝取大量數(shù)據(jù)。在所有數(shù)據(jù)都保留在內(nèi)存中的情況下,Ignite使用MapReduce在整個(gè)分布式群集上執(zhí)行大規(guī)模并行處理(MPP)。利用內(nèi)存數(shù)據(jù)緩存和MPP,與使用基于磁盤的數(shù)據(jù)庫(kù)的應(yīng)用相比,Ignite在規(guī)模上可將應(yīng)用性能提高多達(dá)1000倍。Ignite用戶還可以利用本機(jī)Kafka集成來(lái)輕松地將流數(shù)據(jù)從IoT設(shè)備提取到內(nèi)存計(jì)算集群中。
正如我在上一篇文章中討論的那樣,Ignite可用于構(gòu)建數(shù)字集成中心(DIH),以聚合和處理來(lái)自多個(gè)本地?cái)?shù)據(jù)存儲(chǔ),基于云的數(shù)據(jù)源和流數(shù)據(jù)源的數(shù)據(jù)。作為DIH,Ignite提供了一個(gè)高性能的數(shù)據(jù)訪問(wèn)層,使聚合的數(shù)據(jù)實(shí)時(shí)可用于多個(gè)業(yè)務(wù)應(yīng)用。 Apache Ignite已用于美國(guó)航空、IBM、ING和24 Hour Fitness的生產(chǎn)中。
集群管理
Kubernetes可以自動(dòng)執(zhí)行已在Docker或其他容器解決方案中容器化的應(yīng)用的部署和管理。容器解決方案創(chuàng)建一個(gè)包含應(yīng)用和虛擬化操作系統(tǒng)的軟件包,以使該應(yīng)用可以在同一硬件上或跨虛擬化硬件(例如在云服務(wù)上)運(yùn)行多個(gè)完全獨(dú)立的應(yīng)用版本。Kubernetes使管理Docker容器變得更容易,并確保跨服務(wù)器群集的一致性,該服務(wù)器群集可以部署在任何位置,例如本地、公共或私有云或混合環(huán)境。
API使Kubernetes能夠管理Apache Ignite和流媒體平臺(tái)資源,并自動(dòng)擴(kuò)展基于IoT內(nèi)存計(jì)算的群集。更高的管理簡(jiǎn)便性可以大大降低復(fù)雜性和錯(cuò)誤并減少開發(fā)時(shí)間。Kubernetes用于Booking.com、Capital One、Box、IBM和Sling的運(yùn)營(yíng)中。
分析和機(jī)器學(xué)習(xí)
流平臺(tái)難題的最后一部分是對(duì)數(shù)據(jù)采取行動(dòng)的能力。對(duì)于分析用例,Apache Spark是一個(gè)分布式計(jì)算引擎,用于處理和分析大量數(shù)據(jù)。Spark可以利用Apache Ignite內(nèi)存計(jì)算平臺(tái)來(lái)快速分析通過(guò)流傳輸管道提取的大量數(shù)據(jù)。 Spark還可以將Ignite用作在線數(shù)據(jù)存儲(chǔ),從而使Spark用戶可以將數(shù)據(jù)追加到其現(xiàn)有的DataFrame或RDD中并重新運(yùn)行Spark作業(yè)。 Spark還使在分布式計(jì)算環(huán)境中為非結(jié)構(gòu)化數(shù)據(jù)編寫簡(jiǎn)單查詢變得容易。Spark已在Amazon、Credit Karma、eBay、NTT Data和Yahoo!等運(yùn)營(yíng)中使用。
對(duì)于機(jī)器學(xué)習(xí)用例,Apache Ignite包括集成的、完全分布式的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)庫(kù),這些庫(kù)已針對(duì)大規(guī)模并行處理進(jìn)行了優(yōu)化。這種集成使企業(yè)能夠創(chuàng)建連續(xù)學(xué)習(xí)應(yīng)用,其中機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法將針對(duì)內(nèi)存中計(jì)算集群每個(gè)節(jié)點(diǎn)上的內(nèi)存中數(shù)據(jù)在本地運(yùn)行。在本地運(yùn)行算法可允許在模型上不斷更新模型,因?yàn)樾聰?shù)據(jù)已部署在節(jié)點(diǎn)上,甚至達(dá)到了PB級(jí)。
責(zé)任編輯:pj
-
阿里巴巴
+關(guān)注
關(guān)注
7文章
1629瀏覽量
47752 -
數(shù)字化
+關(guān)注
關(guān)注
8文章
8974瀏覽量
62520 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8460瀏覽量
133437
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server附加數(shù)據(jù)庫(kù)提示“錯(cuò)誤 823”的數(shù)據(jù)恢復(fù)案例

云數(shù)據(jù)庫(kù)是哪種數(shù)據(jù)庫(kù)類型?
數(shù)據(jù)庫(kù)加密辦法
數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Mysql數(shù)據(jù)庫(kù)表記錄丟失的數(shù)據(jù)恢復(fù)流程

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—MYSQL數(shù)據(jù)庫(kù)ibdata1文件損壞的數(shù)據(jù)恢復(fù)案例
數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—通過(guò)拼接數(shù)據(jù)庫(kù)碎片恢復(fù)SQLserver數(shù)據(jù)庫(kù)

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Oracle ASM實(shí)例無(wú)法掛載的數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫(kù)出現(xiàn)823錯(cuò)誤的數(shù)據(jù)恢復(fù)案例

軟件系統(tǒng)數(shù)據(jù)庫(kù)的分庫(kù)分表設(shè)計(jì)

恒訊科技分析:sql數(shù)據(jù)庫(kù)怎么用?
數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫(kù)所在分區(qū)空間不足報(bào)錯(cuò)的數(shù)據(jù)恢復(fù)案例
數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—raid5陣列上層Sql Server數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)案例

數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Sql Server數(shù)據(jù)庫(kù)文件丟失的數(shù)據(jù)恢復(fù)案例

選擇 KV 數(shù)據(jù)庫(kù)最重要的是什么?

評(píng)論