在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

華為云數據創(chuàng)新Lab時序數據存儲與管理正式上線對外商用

華為開發(fā)者社區(qū) ? 來源:華為開發(fā)者社區(qū) ? 作者:華為開發(fā)者社區(qū) ? 2021-09-04 11:28 ? 次閱讀

據研究機構Forrester預測,物聯網所帶來的產業(yè)價值要比互聯網高30倍,到2020年,中國物聯網產業(yè)將成長為一個超過五萬億規(guī)模的巨大市場。

5GAI區(qū)塊鏈等新一代信息技術與物聯網加速融合。在智能互聯的愿景中,物聯網系統(tǒng)的機器、設備和傳感器收集的數據,通過人工智能技術進行分析與關聯,以更有意義的方式服務用戶。然而,隨著物聯網數據量的增長,“時序數據庫”成為企業(yè)面臨的“必答題”。

高性能時序數據庫,是物聯網的數據存儲底座

時序數據庫是一種針對時序數據進行垂直優(yōu)化的數據庫,專門用于存儲和管理時序數據。向宇舉例到,某個酒店在晚上8:00有200個房間被入住,那個8:00時間點上存儲的200的數字就是時序數據。

在物聯網和運維監(jiān)控場景下,如服務器CPU和內存使用量、電動汽車的工況數據、或是應用服務的業(yè)務指標等等,各種被采集的數據指標項多達千萬甚至上億,甚至一次采集的指標數據就可能超過數10GB,這些數據都必須要在規(guī)定時間內全部寫入數據庫。并且,指標數據通常間隔幾秒就會被采集一次,如此海量的時序數據必然要求數據庫要具備大并發(fā)寫入能力和很高的數據壓縮效率。

此外,時序業(yè)務通常還需要將數據從數據庫中檢索出來,以近乎實時的可視化方式展現,方便分析和決策,這對數據庫的查詢性能也有著嚴格的要求。在這種場景下,傳統(tǒng)的關系型數據庫最大的問題在于數據缺少壓縮,查詢效率低下,時序數據庫一開始就被設計為高吞吐、低時延、高數據壓縮率,以滿足物聯網和運維監(jiān)控場景下對性能和儲存成本的訴求。也正是因為時序數據庫的這些特點,在制造業(yè)、銀行金融、社交媒體、能源、智慧家居等行業(yè)領域都有大量的應用場景。

凝結10多年軟硬件技術經驗,未來挑戰(zhàn)重重

根據IDC的一份白皮書預測,到2025年全球數據總量將達到175ZB,這其中30%為時序數據。時序數據庫是在最近10年才真正發(fā)展起來,這期間出現了許許多多的時序數據庫,光DBEngines網站收錄的全球時序數據庫就多達有30多種。

向宇談到,相比關系型數據庫,時序數據庫略微簡單一些,沒有復雜的事務支持,也沒有針對單條數據的更新和刪除操作。但要做好一個時序數據庫并非易事,就像造車一樣,要造好一輛車,單純購買零件組裝測試是遠遠不夠的,還需要考慮質量、性能、舒適性、功能性、安全性等等,一輛車凝結著人類智慧與文化的結晶。

打造一款時序數據庫,需要凝結數十年數據庫領域發(fā)展的硬件和軟件技術和經驗,如存儲、安全、分布式系統(tǒng)、編譯、算法、數據結構、架構設計等等,更要做到系統(tǒng)安全、可靠、穩(wěn)定、高效和多場景通用。“未來會有越來越多的企業(yè)希望利用時序數據庫挖掘出更多有價值的信息,時序數據庫在海量時間線管理、數據壓縮、讀寫性能等方面正面臨著巨大的技術挑戰(zhàn)。”向宇講到。

云原生存算分離架構,華為云數據創(chuàng)新Lab實踐

時序數據庫,作為整個物聯網的數據存儲底座,同時也是云廠商基礎設施的重要部分。作為全球云服務提供商,華為云的迅速發(fā)展,其背后是大量基礎設施的擴張,如何能把所有的基礎設施和云服務完全監(jiān)控起來,是擺在運維團隊面前不得不去解決的技術問題。現有的開源時序數據庫已經不能滿足華為云監(jiān)控數據日益增長的訴求,監(jiān)控指標數量從數百萬迅速增加到數十億,每秒數據寫入量從數億條迅速增長到數十億條,迫切需要一款自研的時序數據庫可以支撐運維團隊的監(jiān)控系統(tǒng)。

在2018年開始,向宇所在的華為云數據創(chuàng)新Lab開始著眼于未來物聯網和運維監(jiān)控場景下的時序數據存儲與管理,自研時序數據庫GaussDB(for Influx)。在經過內部場景的驗證后,GaussDB(for Influx)于2020年正式上線對外商用。

GaussDB(for Influx)采用云原生存儲與計算分離架構,支持分鐘級彈性節(jié)點擴縮容,做到不遷移數據的同時還把事情給做了;支持億級時間線,每天萬億條數據寫入不是問題;支持數據無損壓縮,采用自適應數據壓縮算法,將數據壓縮比提高到1:20;運用MPP架構、向量化、預聚合等相關技術,相比開源的OpenTSDB、InfluxDB等時序數據庫,對于像單時間線條件查詢和多維聚合查詢這類在時序數據庫中較為常見的查詢,性能上有很大幅度的提升。

向宇介紹到,華為云的一個業(yè)務從Cassandra切換到GaussDB(for Influx)后,計算節(jié)點從總共39個(熱集群18個,冷集群9個,大數據分析集群 12個)降低到了9個節(jié)點,縮減4倍計算節(jié)點。存儲空間消耗從每天1TB降低到100GB以內,縮減10倍存儲空間消耗。

目前華為云時序數據庫GaussDB(for Influx)已經服務15+內部和外部客戶,已成為華為云基礎設施重要組成部分。

研發(fā)之路沒有現成的參考答案,迎難而上正面“剛”

回想時序數據庫GaussDB(for Influx)研發(fā)過程的時候,向宇說道,一個系統(tǒng)從誕生到成熟,往往伴隨著長期的Bug修復和結合場景的持續(xù)優(yōu)化。因為任何人都無法提前把所有的應用場景都想到并且測試覆蓋到,GaussDB(for Influx) 也不例外。

當初研發(fā)GaussDB(for Influx)時,向宇團隊遇到的第一個問題就是“進程OOM(內存耗盡觸發(fā)操作系統(tǒng)保護機制)退出”。大家都知道,出現OOM只可能有兩個原因,一是內存泄漏,二是內存真實使用過多。

眾所周知,數據庫里面的數據是存放到磁盤文件,高效率的數據檢索往往需要在內存中建立文件索引,方便快速定位數據在文件中的位置。在時序數據庫中,當數據在數據庫中保留的時間越長,數據文件就會越大,文件數量也就越多。程序重啟過程中,需要將每個數據文件的元數據讀取到內存組織為索引,這里的元數據主要包括當前文件存放有多少時間線,每個時間線的數據在文件中的偏移量等等。在運維監(jiān)控的場景下,時間線的數量是呈指數增長,當時序數據庫的時間線超過億級,虛擬機規(guī)格不變的情況下,問題出現了,元數據無法全部存放內存再轉化為索引,于是程序出現OOM無法重啟。

向宇進一步闡述道,時序數據庫難就難在這里,因為絕大部分用戶或者場景不會達到出現問題的時間線和數據量,面對計算資源有限,而數據量太大的情況,行業(yè)中并無行之有效的現成方法,解決這樣的問題,往往需要結合技術和經驗。舉個例子,程序重啟過程中加載元數據,為避免在內存積壓太多數據,可以選擇限流的方式,那么每次處理的數據量閾值應當如何設置就依賴長期的系統(tǒng)開發(fā)經驗,太大可能問題還會存在,太小又耗時過長。

“有問題不可怕,可怕的是沒有問題。當問題發(fā)生時,我們的選擇是正面‘硬剛’,出現一個消滅一個!”向宇談到。不難看出,也正是他們的這種不畏艱難,用“匠人”精神開發(fā)出華為云基礎設施重要組成部分,并且已經服務15+內部和外部客戶的華為云時序數據庫GaussDB(for Influx)。

原文標題:爆文速遞| 華為云專家向宇:工欲善其事必先利其器,才能做數據的“管家”

文章出處:【微信公眾號:華為開發(fā)者社區(qū)】歡迎添加關注!文章轉載請注明出處。
責任編輯:pj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 華為
    +關注

    關注

    216

    文章

    34519

    瀏覽量

    252514
  • 物聯網
    +關注

    關注

    2912

    文章

    44876

    瀏覽量

    375648
  • 數據庫
    +關注

    關注

    7

    文章

    3842

    瀏覽量

    64574
  • 智慧家居
    +關注

    關注

    1

    文章

    83

    瀏覽量

    16300

原文標題:爆文速遞| 華為云專家向宇:工欲善其事必先利其器,才能做數據的“管家”

文章出處:【微信號:Huawei_Developer,微信公眾號:華為開發(fā)者社區(qū)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    數據怎么存儲在電腦,數據怎么操作才能存儲在電腦

    怎么操作才能存儲在電腦。 ? ?在數字化時代,存儲成為了一種高效、靈活的數據管理方式。通過將數據
    的頭像 發(fā)表于 01-14 10:10 ?87次閱讀
    <b class='flag-5'>數據</b>怎么<b class='flag-5'>云</b><b class='flag-5'>存儲</b>在電腦,<b class='flag-5'>數據</b>怎么操作才能<b class='flag-5'>云</b><b class='flag-5'>存儲</b>在電腦

    構建企業(yè)級文件管理系統(tǒng),輕松搭建 Seafile 社區(qū)版存儲解決方案

    前言 隨著企業(yè)數據量的激增,構建一個安全、高效的企業(yè)級文件管理系統(tǒng)至關重要。華為 Flexus X 服務器,以其靈活的資源配置與卓越的性能,成為部署 Seafile 社區(qū)版
    的頭像 發(fā)表于 01-13 11:14 ?144次閱讀
    構建企業(yè)級文件<b class='flag-5'>管理</b>系統(tǒng),輕松搭建 Seafile 社區(qū)版<b class='flag-5'>云</b><b class='flag-5'>存儲</b>解決方案

    彈性服務器通過什么存儲數據和文件?

    彈性服務器通過多種存儲方式存儲數據和文件,包括硬盤、對象存儲服務、分布式文件系統(tǒng)和
    的頭像 發(fā)表于 01-13 09:50 ?88次閱讀

    時序數據庫TDengine 2024年保持高增長,實現收入翻倍

    近日,時序數據庫 (Time Series Database) TDengine 正式公布了 2024 年重大成就和發(fā)展成績盤點。在這一年中,TDengine 以持續(xù)創(chuàng)新的技術能力、迅猛增長的市場
    的頭像 發(fā)表于 01-02 13:50 ?149次閱讀
    <b class='flag-5'>時序數據</b>庫TDengine 2024年保持高增長,實現收入翻倍

    使用華為 X 實例部署圖數據庫 Virtuoso 并存儲 6500 萬條大數據的完整過程與性能測評

    前言 ? 1. 部署Virtuoso圖數據庫的準備工作 ? 1.1 選擇華為X實例的原因 ? 1.2 Virtuoso圖數據庫簡介 ? 1.3 環(huán)境準備與系統(tǒng)配置 ? 2. Virt
    的頭像 發(fā)表于 12-25 17:51 ?256次閱讀
    使用<b class='flag-5'>華為</b><b class='flag-5'>云</b> X 實例部署圖<b class='flag-5'>數據</b>庫 Virtuoso 并<b class='flag-5'>存儲</b> 6500 萬條大<b class='flag-5'>數據</b>的完整過程與性能測評

    辦公電腦存儲,辦公電腦存儲安全嗎?

    。今天小編要為大家講解辦公電腦存儲安全嗎。 ? ?存儲在辦公環(huán)境中的應用日益廣泛,它為個人和企業(yè)提供了便捷、高效和安全的數據
    的頭像 發(fā)表于 12-21 13:53 ?261次閱讀
    辦公電腦<b class='flag-5'>云</b><b class='flag-5'>存儲</b>,辦公電腦<b class='flag-5'>云</b><b class='flag-5'>存儲</b>安全嗎?

    ipc與存儲的結合應用

    按需訪問數據服務的技術。用戶可以將數據存儲在遠程服務器上,并通過互聯網進行訪問和管理存儲的優(yōu)
    的頭像 發(fā)表于 11-15 14:30 ?327次閱讀

    計算在大數據分析中的應用

    和處理大規(guī)模的數據集。通過計算平臺,用戶可以快速構建數據倉庫,將海量數據進行存儲管理和分析。
    的頭像 發(fā)表于 10-24 09:18 ?548次閱讀

    如何理解計算?

    :**用戶可以使用計算來開發(fā)和部署各種應用程序,通過平臺可以提供靈活的計算資源來支持軟件開發(fā)和部署的過程。 **數據存儲和備份:**用戶可以使用
    發(fā)表于 08-16 17:02

    服務器數據恢復—LeftHand存儲結構&amp;raid故障的數據恢復案例

    LeftHand存儲數據恢復案例: 服務器存儲數據恢復環(huán)境&故障: 該LeftHand存儲中有三組raid,兩個卷,12塊物理硬盤。
    的頭像 發(fā)表于 07-19 10:25 ?356次閱讀
    服務器<b class='flag-5'>數據</b>恢復—LeftHand<b class='flag-5'>存儲</b>結構&amp;raid故障的<b class='flag-5'>數據</b>恢復案例

    華為應用管理和運維平臺ServiceStage全新上線

    2024年5月22日,華為應用管理和運維平臺ServiceStage全新上線,提供基于模板的自動化部署、環(huán)境配置管理、全鏈路灰度發(fā)布、同城
    的頭像 發(fā)表于 05-24 15:24 ?869次閱讀
    <b class='flag-5'>華為</b><b class='flag-5'>云</b>應用<b class='flag-5'>管理</b>和運維平臺ServiceStage全新<b class='flag-5'>上線</b>

    華為舉辦2024創(chuàng)新數據基礎設施論壇,重新定義數據存儲

    5月7日,2024華為創(chuàng)新數據基礎設施論壇(IDI Forum 2024)于德國柏林舉行。
    的頭像 發(fā)表于 05-09 09:41 ?631次閱讀

    時序數據庫是什么?時序數據庫的特點

    時序數據庫是一種在處理時間序列數據方面具有高效和專門化能力的數據庫。它主要用于存儲和處理時間序列數據,比如傳感器
    的頭像 發(fā)表于 04-26 16:02 ?690次閱讀

    身份統(tǒng)一管理創(chuàng)新與優(yōu)化|華為 OneAccess 應用身份管理服務的 2023 年

    企業(yè)亟待解決的首要課題。 華為 OneAccess 是華為在應用身份管理服務領域的重要創(chuàng)新
    的頭像 發(fā)表于 04-07 15:14 ?792次閱讀

    華為推出全新數據湖解決方案及全閃存新品

    近日,華為數據存儲新春新品發(fā)布會上,向全球展示了其全新的數據湖解決方案,以及專為商業(yè)市場與分銷市場設計的全閃存存儲新品。這些
    的頭像 發(fā)表于 02-21 10:35 ?661次閱讀
    主站蜘蛛池模板: 久久精品视频7| 国产h在线| 4hc44四虎www视频| 99久久99久久精品免费看子伦| aaa一级| 夜夜骑日日射| 女人特黄大aaaaaa大片| 一级 黄 色 片免费| 日处女穴| 黄a大片| 97国内精品久久久久久久影视| 免费在线观看的视频| 天天摸天天躁天天添天天爽| 操狠狠| 天天狠天天天天透在线| 凹厕所xxxxbbbb偷拍视频| 国产亚洲网站| 黄色网在线播放| 亚洲涩色| 久久99热精品| 欧美国产精品主播一区| 日本高清免费aaaaa大片视频| xxx69欧美| 91亚洲视频| 99久久成人国产精品免费| 久久国产精品免费专区| 亚洲va中文字幕无码| 一级特黄色片| 亚洲精品色一区色二区色三区| 亚洲一级色| 欧美三级在线免费观看| 国产精品麻豆va在线播放| 国产色视频在线| 午夜精品在线| 奇米99| 91中文字幕视频| 亚洲精品成人久久久影院| 美女网站一区二区三区| 黄色大片aa| www.久色| 天天干天天爽天天射|