在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大數據技術如何進行融合發展

Wildesbeast ? 來源:搜狐新聞 ? 作者:泰一數據 ? 2019-12-21 11:55 ? 次閱讀

當前,全球大數據正進入加速發展時期,技術產業與應用創新不斷邁向新高度。大數據通過數字化豐富要素供給,通過網絡化擴大組織邊界,通過智能化提升產出效能,成為實體經濟質量變革、效率變革、動力變革的技術依托之一,而大數據技術及其融合發展也已經成為最重要的技術發展趨勢。

2019 年以來全球大數據發展在政策方面略顯平淡,其中,美國的發布的《聯邦數據戰略第一年度行動計劃(Federal Data StrategyYear-1 Action Plan)》意味著美國對于數據的重視程度繼續提升,并出現了聚焦點從“技術”到“資產”的轉變,其中更是著重提到了金融數據和地理信息數據的標準統一問題。此外,配套文件中“共享行動:政府范圍內的數據服務”成為亮點,針對數據跨機構協同與共享,從執行機構到時間節點都進行了戰略部署。同時,歐洲議會也通過決議敦促歐盟及其成員國創造一個“繁榮的數據驅動經濟”。該決議預計,到 2020 年歐盟國內生產總值將因更好的數據使用而增加 1.9%。不管是否有更多的大數據政策出臺,拓寬和深入大數據技術應用已經是各國數據戰略的共識。

盡管政策推進略顯緩慢,但大數據底層技術發展日漸成熟。在大數據發展的初期, ApacheHadoop 定義了最基礎的分布式批處理架構,打破了傳統數據庫一體化的模式,將計算與存儲分離,聚焦于解決海量數據的低成本存儲與規模化處理。但當前 MPP 在擴展性方面不斷突破使得 MPP 在海量數據處理領域又重新獲得了一席之位。MapReduce 暴露的處理效率問題以及 Hadoop 體系龐大復雜的運維操作,推動計算框架不斷進行著升級演進。隨后出現的 Apache Spark 已逐步成為計算框架的事實標準。在解決了數據“大”的問題后,數據分析時效性的需求愈發突出,Apache Flink、Kafka Streams、Spark Structured Streaming等近年來備受關注的產品為流處理的基礎框架打下了基礎。在此基礎上,大數據技術產品不斷分層細化,在開源社區形成了豐富的技術棧,覆蓋存儲、計算、分析、集成、管理、運維等各個方面。據統計,目前大數據相關開源項目已達上百個。

隨著當前大數據體系的底層技術框架已基本成熟。大數據技術正逐步成為支撐型的基礎設施,其發展方向也開始向提升效率轉變,逐步向個性化的上層應用聚焦,技術的融合趨勢愈發明顯。“融合”成為大數據技術發展的最重要特征——

l 算力融合:多樣性算力提升整體效率

隨著大數據應用的逐步深入,場景愈發豐富,數據平臺開始承載人工智能物聯網視頻轉碼、復雜分析、高性能計算等多樣性的任務負載。同時,數據復雜度不斷提升,以高維矩陣運算為代表的新型計算范式具有粒度更細、并行更強、高內存占用、高帶寬需求、低延遲高實時性等特點,因此當前以 CPU 為調度核心,協同 GPUFPGAASIC 及各類用于 AI 加速“xPU”的異構算力平臺成為行業熱點解決方案,以 GPU為代表的計算加速單元能夠極大提升新業務計算效率。

不同硬件體系融合存在開發工具相互獨立、編程語言及接口體系不同、軟硬件協同缺失等工程問題。為此,產業界試圖從統一軟件開發平臺和開發工具的層面來實現對不同硬件底層的兼容,如 Intel公司正在設計支持跨多架構(包括 CPU、GPU、FPGA 和其他加速器)開發的編程模型 oneAPI,它提供一套統一的編程語言和開發工具集,來實現對多樣性算力的調用,從根本上簡化開發模式,針對異構計算形成一套全新的開放標準。

l 流批融合:平衡計算性價比的最優解

流處理能夠有效處理即時變化的信息,從而反映出信息熱點的實時動態變化。而離線批處理則更能夠體現歷史數據的累加反饋。考慮到對于實時計算需求和計算資源之間的平衡,業界很早就有了 lambda架構的理論來支撐批處理和流處理共同存在的計算場景。隨著技術架構的演進,流批融合計算正在成為趨勢,并不斷在向更實時更高效的計算推進,以支撐更豐富的大數據處理需求。

流計算的產生來源于對數據加工時效性的嚴苛要求。數據的價值隨時間流逝而降低時,我們就必須在數據產生后盡可能快的對其進行處理,比如實時監控、風控預警等。如,近年來出現的 Apache Flink,則使用了流處理的思想來實現批處理,很好地實現了流批融合的計算,國內包括阿里、騰訊、百度、字節跳動,國外包括 Uber、Lyft、Netflix 等公司都是Flink 的使用者。

l TA 融合:混合事務/ 分析支撐即時決策

TA 融合是指事務(Transaction)與分析(Analysis)的融合機制。在數據驅動精細化運營的今天,海量實時的數據分析需求無法避免。分析和業務是強關聯的,但由于這兩類數據庫在數據模型、行列存儲模式和響應效率等方面的區別,通常會造成數據的重復存儲以及數據時效性不足的問題。

混合事務/分析處理(HTAP)是實現在單一的數據源上不加區分的處理事務和分析任務。當前的方案主要有三種:一是基于傳統的行存關系型數據庫(類似 MySQL)實現事務特性,并在此基礎上通過引入計算引擎來增加復雜查詢的能力;二是在行存數據庫(如 Postgres-XC 版本)的基礎上增加列存的功能,來實現分析類業務的需求;三是基于列存為主的分析型數據庫(如 Greenplum),增加行存等功能優化,提供事務的支持。但由于沒有從根本上改變數據的存儲模式,三種方案都會在事務或分析功能上有所側重,無法完美的在一套系統里互不干擾地處理事務和分析型任務,無法避免對數據的轉換和復制,但能在一定程度上縮短分析型業務的時延。

l 模塊融合:一站式數據能力復用平臺

大數據的工具和技術棧已經相對成熟,大公司在實戰經驗中圍繞工具與數據的生產鏈條、數據的管理和應用等逐漸形成了能力集合,并通過這一概念來統一數據資產的視圖和標準,提供通用數據的加工、管理和分析能力。

數據能力集成的趨勢打破了原有企業內的復雜數據結構,使數據和業務更貼近,并能更快地使用數據驅動決策。主要針對性地解決三個問題:一是提高數據獲取的效率;二是打通數據共享的通道;三是提供統一的數據開發能力。這樣的“企業級數據能力復用平臺”是一個由多種工具和能力組合而成的數據應用引擎、數據價值化的加工廠,來連接下層的數據和上層的數據應用團隊,從而形成敏捷的數據驅動精細化運營的模式。其中,阿里巴巴提出的“中臺”概念和華為公司提出的“數據基礎設施”概念都是模塊融合趨勢的印證。

l 云數融合:云化趨勢降低技術使用門檻

大數據基礎設施向云上遷移是一個重要的趨勢。各大云廠商均開始提供各類大數據產品以滿足用戶需求,紛紛構建自己的云上數據產品。比如 Amazon Web Service(AWS)和 Google CloudPlatform(GCP)很早就開始提供受管理的 MapReduce 或 Spark 服務,以及國內阿里云的 MaxCompute、騰訊云的彈性 MapReduce 等,大規模可擴展的數據庫服務也紛紛上云,比如 Google BigQuery、AWS Redshift、阿里云的 PolarDB、騰訊云的 Sparkling 等,來為 PB 級的數據集提供分布式數據庫服務。華為也在近期注冊成立了華為云計算技術公司。早期的云化產品大部分是對已有大數據產品的云化改造,現在,越來越多的大數據產品從設計之初就遵循了云原生的概念進行開發,生于云長于云,更適合云上生態。向云化解決方案演進的最大優點是用戶不用再操心如何維護底層的硬件和網絡,能夠更專注于數據和業務邏輯,在很大程度上降低了大數據技術的學習成本和使用門檻。

l 數智融合:數據與智能多方位深度整合

大數據與人工智能的融合則成為大數據領域當前最受關注的趨勢之一,這種融合主要體現在大數據平臺的智能化與數據治理的智能化。智能的平臺促成了大數據平臺和機器學習平臺深度整合的趨勢,大數據平臺在支持機器學習算法之外,還將支持更多的 AI 類應用。如,Databricks 為數據科學家提供一站式的分析平臺 Data Science Workspace,Cloudera 也推出了相應的分析平臺 Cloudera Data Science Workbench。其次,數據治理與人工智能的發展存在相輔相成的關系:一方面,數據治理為人工智能的應用提供高質量的合規數據;另一方面,人工智能對數據治理存在諸多優化作用。AI 使能數據治理,是通過智能化的數據治理使數據變得智能:通過智能元數據感知和敏感數據自動識別,對數據自動分級分類,形成全局統一的數據視圖。通過智能化的數據清洗和關聯分析,把關數據質量,建立數據血緣關系。數據能夠自動具備類型、級別、血緣等標簽,在降低數據治理復雜性和成本的同時,得到智能的數據。

伴隨著技術融合與應用的不斷深化與發展,大數據的產業規模也在近年穩步提升。有機構預測,到2020年,全球大數據市場的收入規模將達到 560 億美元,較2018 年的預期水平增長約 33.33%,較 2016 年的市場收入規模翻一倍。隨著市場整體的日漸成熟和新興技術的不斷融合發展,未來大數據市場將呈現穩步發展的態勢,增速維持在 14%左右。在 2018-2020 年的預測期內,大數據市場整體的收入規模將保持每年約 70 億美元的增長。在具體的細分市場中,大數據硬件、軟件和服務的市場規模均保持較穩定的增長,并隨著機器學習、高級分析算法等技術的成熟與融合,更多的數據應用和場景正在落地,大數據軟件市場將繼續高速增長。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1630

    文章

    21776

    瀏覽量

    604678
  • 數據庫
    +關注

    關注

    7

    文章

    3840

    瀏覽量

    64544
  • 大數據
    +關注

    關注

    64

    文章

    8900

    瀏覽量

    137580
收藏 人收藏

    評論

    相關推薦

    2016汽車與信息通信融合發展論壇

    。會議將以“新一代信息通信技術影響下的汽車產業發展之路”為主題,圍繞兩化融合、先進ICT技術應用、大數據對產業的驅動等內容開展深入研究,探討
    發表于 07-07 14:47

    北斗模塊助力北斗導航系統加速推進軍民融合發展

    `近日,為期7天的第三屆軍民融合發展技術裝備成果展覽暨論壇在北京落下帷幕。 展會展示了我國近年來在信息技術領域軍民融合發展的具有自主知識產權的核心關鍵
    發表于 09-27 12:27

    常見大數據應用有哪些?

    大數據技術為決策提供依據,在***、企業、科研項目等決策中扮演著重要的角色,在社會治理和企業管理中起到了不容忽視的作用,很多國家,如中國、美國以及歐盟等都已將大數據列入國家發展戰略,微
    發表于 03-13 16:50

    大數據運用的技術

    大數據是對海量數據進行存儲、計算、統計、分析處理的一系列處理手段,處理的數據量通常是TB級,甚至是PB或EB級的數據,這是傳統
    發表于 04-08 16:50

    大數據開發核心技術詳解

    數據的核心是云技術和BI。關于大數據和云計算的關系人們通常會有誤解,而且也會把它們混起來說,分別做一句話直白解釋就是:云計算就是硬件資源的虛擬化;大數據就是海量
    發表于 07-26 16:26

    NLPIR系統KGB知識圖譜技術助力大數據深度挖掘

    大數據技術不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。換言之,如果把大數據
    發表于 12-05 11:49

    BAW技術推進大數據發展

    近日,德州儀器的Ahmad Bahai博士發表文章《Disruptive TI BAW technology accelerates big data on the information superhighway》,解析TI體聲波(BAW)技術對于大數據
    發表于 07-29 07:34

    阿里巴巴高級技術專家章劍鋒:大數據發展的 8 個要點

    看到的表相,本質還是數據自身。在我們講清楚大數據的含義之后,我們來聊聊大數據目前到底處在一個什么樣的位置。從歷史發展的角度來看,每一項新技術
    發表于 10-14 10:56

    大數據技術視閾下如何進行偵查工作的轉型

    大數據技術視閾下】偵查工作的轉型發展與完善進路
    發表于 04-24 15:09

    百度夯實“云智數”融合發展 助力企業智能化升級

    百度夯實云智數融合發展 助力企業智能化升級 11月30日,首屆百度云智峰會將在北京國際會議中心正式召開。峰會將以智能,計算無限可能為主題,聚焦云計算、人工智能、大數據三大技術領域,并以此為創新與合作的平臺,進一步夯實百度云智數
    發表于 11-28 16:48 ?1007次閱讀

    物聯網是大數據的重要來源,大數據助力物聯網

    物聯網產生大數據,大數據助力物聯網。由物聯網引發的大數據潮流還將助推云計算等信息通信新技術融合發展
    的頭像 發表于 01-23 16:01 ?1.2w次閱讀

    如何推動區塊鏈與大數據融合發展

    區塊鏈被公認作數字化轉型中的底層基礎設施,而數字化轉型中數據將是核心生產要素,如果能夠將區塊鏈與大數據技術融合,覆蓋數據確權、交易、保護、流
    發表于 03-05 11:28 ?2711次閱讀

    互聯網中OT與IT融合發展的需求分析

    互聯網、物聯網、大數據、人工智能、邊緣計算等信息技術(IT)越來越多地滲透到工業領域,并與工業技術進行融合發展,產生了以工業互聯網為代表的工
    的頭像 發表于 04-07 11:34 ?4338次閱讀
    互聯網中OT與IT<b class='flag-5'>融合發展</b>的需求分析

    大數據分解-融合研究綜述

    文中給出了通過大數據分解、融合生成的大數據分解-融合以及大數據距離;利用這些概念,給出了大數據
    發表于 05-28 15:43 ?8次下載

    如何對大數據進行分析和處理?

    大數據時代已經來臨,所以我們對大數據這個詞已經不再陌生,甚至于大數據已經作為一門前沿科學,成為廣大高校開展招生的熱門專業,其前景良好并且內容廣泛。其實,如果想要深入理解大數據沒有想象的
    的頭像 發表于 02-01 10:33 ?2675次閱讀
    主站蜘蛛池模板: 亚洲第一色图| 天天狠狠弄夜夜狠狠躁·太爽了| 高清午夜毛片| 日本老师69xxxxxxxxx| 久色tv| 国产亚洲3p一区二区三区| 精品国内一区二区三区免费视频| 黄色三级视频| www.色偷偷| 亚洲三级色| 国产三级a三级三级野外| 日韩精品视频免费观看| 欧美一卡二三卡四卡不卡| 女毛片| 国产单男| 天天操天天摸天天射| 国产国产成人人免费影院 | 日本大片免费观看视频| 欧美在线1| 国产三级精品在线| 亚洲国产影视| 久久草在线观看| 国产视频黄色| 高h上错人1v1| 五月婷婷亚洲综合| 你懂的在线视频播放| 岛国三级在线看| 午夜想想爱午夜剧场| 免费一看一级毛片| 666精品国产精品亚洲| 美女黄18以下禁止观看的网站| 手机在线完整视频免费观看| 亚洲www在线| 性欧美久久| 免费黄色一级| 亚色在线| 在线欧美激情| 99 久久99久久精品免观看| 色视频在线观看网站| 国产美女一级ba大片免色| 人人射人人草|