在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

湖倉一體:揭秘數據湖架構現代化之道

IBM中國 ? 來源:未知 ? 2023-07-24 19:00 ? 次閱讀
wKgZomToE96AXq46AAUH1WcibZI849.gifwKgZomToE96Aa8dEAAIo1cbXNhk136.png作者:Hebert W. Pereyra,IBM 杰出工程師,Hybrid Data Management 首席架構師;譯者:劉俊 ,IBM watsonx.data 開發架構師

數據湖誕生至今已有十多年的歷史,為全球一些最大的企業提供了數據分析的支持。然而,也有人認為,絕大多數數據湖部署已經演變成為“數據沼澤”。不論你站在哪一邊,現實情況是,這些系統中仍然承載著大量的數據。這些數據規模龐大,使得移動、遷移或對其進行現代化都變得異常困難。

數據湖的巨大挑戰:單一結構的架構問題

從較高層次來看,數據湖是一個大規模的單一數據存儲庫。數據可以以原始形式存儲,也可以經過優化,采用適合專用引擎使用的不同格式。

就 Hadoop 而言,它是最受歡迎的數據湖之一,通過使用開源軟件實現該存儲庫,并在通用硬件上運行,可以以非常低的成本在系統中存儲大量數據。數據可以以開放的數據格式進行持久化,從而實現了數據消費的民主化,并通過自動復制提供了高可用性的支持。默認的處理框架具備從故障中恢復的能力。這無疑是與傳統分析環境有著顯著差異的重要轉變,傳統數據分析環境往往意味著供應商鎖定以及無法處理大規模數據。

另一個出乎意料的挑戰是將 Spark 引入作為大數據處理框架。由于其支持數據轉換、流式處理和 SQL,它迅速獲得了廣泛的認可。然而,它并未能與現有的數據湖環境友好共存,因此通常需要額外的專用計算集群才能運行 Spark。

我們將時間前移 15 年回到當下,現實已經清楚地表明了這項技術所涉及的權衡和妥協。其快速的采用意味著客戶很快失去了對數據湖中數據的追蹤。同樣具有挑戰的是,他們無法確定數據的來源、獲取方式以及在處理過程中的轉換方式。數據治理仍然是這項技術中尚未探索的領域。雖然軟件可能是開源的,但需要有人學習如何使用、維護和支持它。僅依賴社區支持并不能持續滿足業務運營所需的響應時間。高可用性通過復制實現則意味著需要更多磁盤上的數據副本,增加存儲成本,并導致故障更加頻繁。而高可用的分布式處理框架則意味著不得不在性能方面做出妥協,以換取彈性(這將導致交互式分析和商業智能的性能嚴重下降)。

為何要對數據湖進行現代化?

數據湖在特定的使用場景中已經被證明是成功的。然而清楚的是,企業迫切需要對這些部署進行現代化,保護基礎設施、技能和存儲在這些系統中的數據的投資。

在尋找答案的過程中,行業研究了現有的數據平臺技術及其優勢。很明顯,有效的方法是將傳統的(或者說是遺留的)數據倉庫或數據集市的關鍵特性與數據湖的優勢結合起來。以下幾個關鍵要素迅速浮出水面:

  • 具備彈性和可擴展的存儲,能夠滿足日益增長的數據規模需求。

  • 采用開放的數據格式,使數據對所有人都可訪問,同時針對高性能進行優化,并具備良好定義的結構。

  • 開放的元數據(可共享),能夠支持多個消費引擎或框架。

  • 支持數據更新(ACID 特性)和事務并發處理。

  • 綜合的數據安全和數據治理(如數據血緣、完整的數據訪問策略定義和執行,包括地理分布)。

上述要素導致了湖倉一體的出現。湖倉一體是一種數據平臺,是將數據倉庫和數據湖的優點融合在一起,形成統一、協調的數據管理解決方案

利用 watsonx.data 來現代化數據湖的好處

站在當下數據分析的十字路口,IBM 的回應是為企業提供 watsonx.data 解決方案,這是一個用于大規模數據管理的新型開放式數據存儲,允許企業在無需遷移的情況下圍繞、增強和現代化其現有的數據湖和數據倉庫。它支持開放式的多云與混合云,可以在客戶管理的基礎設施(本地或者私有云)和公有云上運行。它建立在湖倉一體架構之上,并嵌入了一整套解決方案(以及通用軟件堆棧),適用于所有形態。

與市場上的競品相比,IBM 的方法基于開源堆棧和架構。這些組件并不是新的,而是業界已經廣泛使用的成熟組件。IBM 關注它們的互操作性、共存性和元數據交換。用戶可以快速入門,從而大大降低了入門和使用的成本,因為其上層架構和基礎概念是大家熟悉且直觀的:

  • 通過對象存儲實現開放的數據(和表格格式)

  • 通過 S3 進行數據訪問

  • 使用 Presto 和 Spark 進行查詢計算(SQL、數據科學、轉換和流處理)

  • 通過 Hive 和兼容結構實現開放的元數據共享

Watsonx.data 為企業提供了一種保護他們在數據湖和數據倉庫數十年投資的方式,使企業可立即擴展并逐步現代化其安裝,將每個組件專注于對企業最重要的使用場景。

一個關鍵的差異化因素是多引擎策略,允許用戶在統一的數據平臺上根據實際情況選擇適合的技術。watsonx.data 使客戶能夠實現完全動態的分層存儲(以及相關的計算)。隨著時間的推移,這可以帶來非常顯著的數據管理和處理的成本節省。

如果最終企業的目標是通過湖倉一體架構來現代化現有的數據湖部署,那么 watsonx.data 則通過選擇計算方式來最小化數據遷移和應用遷移,從而簡化了任務。

接下來可以做什么?

在過去的幾年里,數據湖在大多數企業的數據管理策略中發揮了重要作用。如果企業的目標是對其數據管理策略進行演進和現代化,使之成為真正的混合分析云架構,那么 IBM 基于湖倉一體架構而構建的新型數據存儲 watsonx.data,則是值得企業考慮的技術選擇

相關資料

1. 點擊下載電子書:《為 AI 而設的數據存儲》:

https://www.ibm.com/account/reg/us-en/signup?formid=urx-52131

2. 點擊閱讀 IBM watsonx.data 解決方案簡介:

https://www.ibm.com/downloads/cas/4Z1YXEBO

3. 瀏覽 watsonx.data 的產品頁面了解更多:

https://www.ibm.com/products/watsonx-data

關于 IBM

IBM 是全球領先的混合云、人工智能及企業服務提供商,幫助超過 175 個國家和地區的客戶,從其擁有的數據中獲取商業洞察,簡化業務流程,降低成本,并獲得行業競爭優勢。金融服務、電信和醫療健康等關鍵基礎設施領域的超過 4000 家政府和企業實體依靠 IBM 混合云平臺和 Red Hat OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業云解決方案和企業服務方面的突破性創新為我們的客戶提供了開放和靈活的選擇。對企業誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業務發展的基石。

了解更多信息,請訪問:https://www.ibm.com/cn-zh


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • IBM
    IBM
    +關注

    關注

    3

    文章

    1758

    瀏覽量

    74724

原文標題:湖倉一體:揭秘數據湖架構現代化之道

文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    戴爾數據助力企業數字轉型

    在數字轉型的浪潮下,企業正面臨著前所未有的數據挑戰。從傳統的結構數據到如今的非結構數據、半
    的頭像 發表于 12-20 09:31 ?123次閱讀

    OBOO鷗柏丨PLC嵌入式工控一體機進軍現代工廠產線電子看板市場

    OBOO鷗柏作為嵌入式工控一體現代化品牌源頭工廠,將進軍自動機柜相關應用場景的市場規劃,OBOO鷗柏工控一體機,觸摸屏查詢一體機相關數字
    的頭像 發表于 11-13 12:28 ?210次閱讀
    OBOO鷗柏丨PLC嵌入式工控<b class='flag-5'>一體</b>機進軍<b class='flag-5'>現代</b>工廠產線電子看板市場

    測控一體化閘門遠程監控運維系統解決方案

    灌區通常需要根據灌區面積和用水需求進行合理規劃,實現主干渠、支渠、斗渠各個閘門的合理部署,是現代化灌區的重要內容。測控一體化閘門是種集成了測量和控制功能的現代化水工設施,不僅能夠實現
    的頭像 發表于 09-30 17:03 ?338次閱讀
    測控<b class='flag-5'>一體化</b>閘門遠程監控運維系統解決方案

    一體成型電感感值低的原因

    12、谷景揭秘一體成型電感感值低的
    發表于 07-30 10:41 ?0次下載

    安消一體化平臺建設方案

    與消防一體化平臺已成為迫切需求。本文古河云科技將詳細介紹針對企業安全生產和消防管理需求的一體化平臺建設方案。 首先,安消一體化平臺的系統架構應該包括前端展示層、后端
    的頭像 發表于 07-26 14:14 ?398次閱讀

    啟揚多尺寸安卓屏一體機,助力水肥一體機實現智能農田管理

    隨著科技的飛速發展,農業現代化已然成為趨勢。在農業領域,水肥一體機通過引入傳感器、物聯網、大數據等信息技術,精準控制水肥配比與投放,為作物提供精準的水肥管理方案,提高作物產量,改善農產品品質,降低
    的頭像 發表于 07-06 08:00 ?352次閱讀
    啟揚多尺寸安卓屏<b class='flag-5'>一體</b>機,助力水肥<b class='flag-5'>一體</b>機實現智能<b class='flag-5'>化</b>農田管理

    什么是機電一體化?它有哪些應用?

    在科技飛速發展的今天,機電一體化技術已成為現代工業生產的核心驅動力之。它融合了機械工程、電子技術、計算機技術、信息技術等多學科的理論與技術,實現了機械與電子的有機結合,極大地推動了制造業的智能
    的頭像 發表于 06-11 14:02 ?5083次閱讀

    什么是數據數據數據倉庫有什么區別?

    從本質上說,數據就是個信息資源庫。人們常常將數據數據倉庫混為
    的頭像 發表于 05-20 12:38 ?623次閱讀
    什么是<b class='flag-5'>數據</b><b class='flag-5'>湖</b>?<b class='flag-5'>數據</b><b class='flag-5'>湖</b>和<b class='flag-5'>數據</b>倉庫有什么區別?

    護河聯合執法 解決通信是關鍵

    我國實行河長制進行生態環境保護以來,對、河的保護治理取得了不錯的成績。隨著治理的深入,在許多大型湖泊以及西北、西南等省界、市界偏遠地區,常常需要岸與、省與省、市與市之間進行聯合執法,進
    的頭像 發表于 05-07 08:28 ?255次閱讀
    巡<b class='flag-5'>湖</b>護河聯合執法  解決通信是關鍵

    華為推出數據解決方案及全閃存存儲新品

    此次發布的新品包括OceanStor Dorado 2100,這是業界首款面向非結構數據設計的A-A架構入門級全閃存NAS,還有對應升級的SAN存儲OceanStor Dorado 2000和支持SAN&NAS
    的頭像 發表于 02-20 14:18 ?566次閱讀

    IBM Storage Ceph:現代數據的理想技術底座

    Storage)。在此期間,企業在擴展 AI 時正面臨前所未有的數據挑戰:在多個位置、以多種形式存儲的數據量飆升,但數據質量較差。為了幫助客戶解決這問題,我們需要領先的解決方案對客
    的頭像 發表于 02-02 10:24 ?619次閱讀
    IBM Storage Ceph:<b class='flag-5'>現代數據</b><b class='flag-5'>湖</b><b class='flag-5'>倉</b>的理想技術底座

    揭秘一體:大數據演進的未來趨勢與影響

    一體架構下,數據要統存儲管理,一份數據作為
    的頭像 發表于 01-29 14:17 ?990次閱讀
    <b class='flag-5'>揭秘</b><b class='flag-5'>湖</b><b class='flag-5'>倉</b><b class='flag-5'>一體</b>:大<b class='flag-5'>數據</b>演進的未來趨勢與影響

    什么是通感算一體化?通感算一體化的應用場景

    通感算一體化可廣泛應用于智能家居、智慧城市、智慧交通、醫療健康等方面。文檔君為大家搜集了些典型的應用場景。 智能家居 通感算一體化利用基站或者Wi-Fi路由器為智能家居系統提供更加豐富的功能。
    發表于 01-18 16:12 ?1.2w次閱讀
    什么是通感算<b class='flag-5'>一體化</b>?通感算<b class='flag-5'>一體化</b>的應用場景

    構建高效數據生態:數據庫、數據倉庫、數據、大數據平臺與數據中臺解析_光點科技

    在數字的浪潮中,套高效的數據管理系統是企業競爭力的核心。從傳統的數據庫到現代數據中臺,每
    的頭像 發表于 01-17 10:20 ?379次閱讀

    基于工業智能網關的城鄉一體化供水物聯網解決方案

    、方案背景 隨著城市進程的加快,城鄉供水需求不斷增長,傳統的人工管理方式已無法滿足現代化供水系統的需求。為了解決這問題,物通博聯提供基于工業智能網關的城鄉
    的頭像 發表于 01-08 14:02 ?357次閱讀
    基于工業智能網關的城鄉<b class='flag-5'>一體化</b>供水物聯網解決方案
    主站蜘蛛池模板: 午夜一级毛片看看| 久久一级毛片| 日日射夜夜| 国产一区精品视频| 四虎海外在线永久免费看| 99久热只有精品视频免费观看17| 一区二区三区中文国产亚洲| 免费精品美女久久久久久久久| 天堂资源在线官网资源| 欧美成人猛男性色生活| 亚洲午夜在线观看| 亚洲综合色网站| 天天骑天天干| 国内精品第一页| 午夜黄色网址| 国产伦精品一区二区三区女| 午夜片在线观看| 日日舔夜夜操| www.天天操.com| 久久久国产乱子伦精品| 天天天天天操| 成 人色 网 站999| 激情婷婷六月| 成人v| 狠狠曹| 九九99视频在线观看视频观看 | 97久久伊人精品影院| 国产一区二区三区美女在线观看 | 天天射色综合| 91福利专区| 色综合天天射| 色播五月综合| 视色4se成人午夜精品| 你懂的在线观看网站| 欧美色天使| 日本免费黄视频| 日本理论午夜中文字幕第一页| 毛片你懂的| 偷偷狠狠的日日2020| 1024手机在线观看你懂的| 99热最新在线观看|