玄幻小说完本,玄幻小说,武道至尊帝临小说

AWS re:Invent2019顯示AWS市場占用率達(dá)到45%，相比2018年營收增長29%。使用專用芯片構(gòu)建用于加速特定場景的戰(zhàn)略更加清晰，除去Intel和AMD的X86和Nvidia GPU，還有通過其Annapurna Labs部門推出的基于Arm的Graviton的定制芯片，并承諾基于Graviton2（7納米）的新型EC2實例的性能是第一代Graviton的7倍。

早在摩爾定律失效之前，一個逐漸達(dá)成的共識就是通用處理器的算力應(yīng)該專注于復(fù)雜的商業(yè)邏輯，而簡單重復(fù)的工作則由專用芯片完成更加合適。

超算和智能網(wǎng)卡

早在20年以前，基于異構(gòu)計算的智能網(wǎng)卡就已經(jīng)應(yīng)用于超算（HPC）領(lǐng)域。從1993年開始 TOP500 就以每年兩次的頻率，基于 Linpack benchmark 負(fù)載模型來統(tǒng)計地球上運行最快的超級計算集群。

2003年，弗吉尼亞理工學(xué)院暨州立大學(xué)創(chuàng)建一個InfiniBand集群，在當(dāng)時的TOP500排名第三；

2009年，世界500強超級算機中，152個使用InfiniBand，并提供38.7%的算力；

2020年11月，根據(jù)最新的第56版，155個使用 InfiniBand，并提供40%的算力，排名前10的超算集群有8個由 InfiniBand 構(gòu)建，更是占據(jù)了前5的4席位置。

在構(gòu)建高速網(wǎng)路時，爭論主要是把網(wǎng)絡(luò)功能Onload到CPU上，還是把這些功能Offload到專用硬件：

常用Onloading，TCP/IP技術(shù)在數(shù)據(jù)包從網(wǎng)卡到應(yīng)用程序的過程中，要經(jīng)過OS，數(shù)據(jù)在主存、CPU緩存和網(wǎng)卡緩存之間來回復(fù)制，給服務(wù)器的CPU和主存造成負(fù)擔(dān)，也加劇網(wǎng)絡(luò)延遲。

Offloading 基于RDMA實現(xiàn)遠(yuǎn)程內(nèi)存直接訪問，將數(shù)據(jù)從本地快速移動到遠(yuǎn)程主機應(yīng)用程序的用戶空間，通過Zero-copy和Kernel bypass來實現(xiàn)高性能的遠(yuǎn)程直接數(shù)據(jù)存取的目標(biāo)。

下圖可以直觀的看到兩者在訪問路徑的區(qū)別：

當(dāng)然，Offloading 需要將RDMA協(xié)議固化于硬件上，所以依賴于網(wǎng)卡的算力是否可以滿足運行RDMA協(xié)議的開銷，這實際上就是專用芯片和網(wǎng)卡的結(jié)合。用更性感的說法是

SmartNICs are an example of DPU （Data Processing Unit） technology

AWS和Nitro

云計算催生超大規(guī)模數(shù)據(jù)中心，也同時放大通用算力的不足和異構(gòu)計算的優(yōu)勢。就好比研發(fā)團(tuán)隊規(guī)模變大的同時必然走向?qū)I(yè)化。AWS EC2早期由純軟（也意味著需要消耗CPU）的Xen對CPU、存儲和網(wǎng)絡(luò)完成虛擬化。基于這種實現(xiàn)方式，一個EC2實例的虛擬化管理開銷高達(dá)30%。

30%相當(dāng)可觀，最重要的是并沒有為客戶提供直接價值。按照 Werner Vogels（AWS CTO ）的說法

想為客戶顯著提高性能、安全性和敏捷性，我們必須將大部分管理程序功能遷移到專用硬件上。

2012年，AWS開始構(gòu)建Nitro系統(tǒng)，也正是這，登納德縮放定律（嚴(yán)格說是預(yù)測）幾乎消失：

2013年， Nitro 應(yīng)用于C3實例，其網(wǎng)絡(luò)進(jìn)程卸載到硬件中；

2014年，推出了C4實例類型，將EBS存儲卸載到硬件中，并開始和Annapurna Labs合作；

2015年，收購 Annapurna Labs；

2017年，C5實例卸載控制平面和剩余的I/O，實現(xiàn)完整的Nitro系統(tǒng)；

此時，Nitro系統(tǒng)已經(jīng)包含三個主要部分：Nitro卡、Nitro安全芯片和Nitro管理程序。主要卸載和加速IO，虛擬私有云（VPC）、彈性塊存儲（EBS）和實例存儲，從而讓用戶可以使用100%的通用算力。

對客戶而言，意味更好的性能和價格，下圖可以看到基于Nitro的C5和I3.metal的延時明顯降低：

計算型存儲和數(shù)據(jù)庫

從AWS的營收看，網(wǎng)絡(luò)、存儲、計算和軟件是收入的四駕馬車，數(shù)據(jù)庫毫無疑問是存儲領(lǐng)域的關(guān)鍵場景。隨著云計算帶來基礎(chǔ)環(huán)境的改變，也直接加速云原生技術(shù)的發(fā)展和成熟，程序員不會再寫出單體（Monolithic）應(yīng)用，也再也不會在應(yīng)用中只使用一種數(shù)據(jù)庫。還是借用Werner Vogels的話

A one size fits all database doesn‘t fit anyone.

從AWS提供的數(shù)據(jù)庫服務(wù)也應(yīng)證了一點（國內(nèi)的云計算巨頭也類似）。

不同的數(shù)據(jù)庫針對不同的場景，比如Airbnb使用 Aurora 替代 MySQL，Snapchat 使用DynamoDB 承載起最大的寫負(fù)載，麥當(dāng)勞將ElastiCache應(yīng)用于低延時高吞吐的工作負(fù)載，旅游網(wǎng)站expedia.com使用ElasticSearch實時優(yōu)化產(chǎn)品價格。當(dāng)然，對于存儲介質(zhì)，更快速和更大容量的需求普遍存在。從下面數(shù)據(jù)庫的工程實踐看，壓縮是實現(xiàn)這一目標(biāo)的共識：

DB-Engines DBMS數(shù)據(jù)壓縮特性

DBMS

是否支持?jǐn)?shù)據(jù)壓縮

Oracle

MySQL

Microsoft SQL Server

PostgreSQL

MongoDB

IBM Db2

Elasticsearch

Redis

SQLite

Cassandra

壓縮率依賴于數(shù)據(jù)本身，1948年由美國數(shù)學(xué)家克勞德·香農(nóng)（Claude Shannon）在經(jīng)典論文《通信的數(shù)學(xué)理論》中首先提出信息熵，理想情況下，不管是什么樣內(nèi)容的數(shù)據(jù)，只要具有同樣的概率分布，就會得到同樣的壓縮率。

在實現(xiàn)時，常常要在壓縮吞吐，解壓吞吐，和犧牲壓縮率之間做取舍，這也是產(chǎn)生諸多壓縮算法的原因。下圖是基于Silesia compression corpus不同壓縮算法之間的差異。

Compressor Name

Ratio

CompressionDecompress

zstd 1.4.5 -1

2.884

500MB/S

1660MB/S

zlib 1.2.11 -1

2.743

90MB/S400MB/S

brotli 1.0.7 -0

2.703

400MB/S450MB/S

zstd 1.4.5--fast=1

2.434

570MB/S2200MB/S

zstd 1.4.5--fast=3

2.312

640MB/S2300MB/S

quicklz 1.5.0 -1

2.238

560MB/S710MB/S

zstd 1.4.5 --fast=5

2.178

700MB/S2420MB/S

lzo1x 2.10 -1

2.106

690MB/S820MB/S

lz4 1.9.2

2.101

740MB/S4530MB/S

lzf 3.6 -1

2.077

410MB/S860MB/S

snappy 1.1.8

2.073

560MB/S1790MB/S

從一個常見的場景出發(fā)，應(yīng)用多次寫入壓縮率各不相同的數(shù)據(jù)，邏輯寫入量為36KB，如下圖所示：

按照前面所示的壓縮率，最理想的情況是壓縮后占用15.2KB。

但現(xiàn)有的空間管理實踐會占用更多的物理空間，首先寫入時需要按照文件系統(tǒng)頁對齊寫入（假設(shè)4KB），占用物理空間為48KB，數(shù)據(jù)存儲分布如下圖所示：

但因為壓縮后數(shù)據(jù)依然需要按照文件系統(tǒng)頁大小（4KB）對齊，數(shù)據(jù)存儲分布如下圖所示：

所以實際占用的物理空間是36KB離預(yù)期的壓縮率相去甚遠(yuǎn)。

為進(jìn)一步提升壓縮效率，通常會進(jìn)一步壓實（compaction）空間，壓實后數(shù)據(jù)存儲分布如下：

這時占用的物理空間是 16KB，才接近15.2KB。

可見在工程實踐時，要想在應(yīng)用場景中獲得可觀的壓縮收益，僅關(guān)注數(shù)據(jù)結(jié)構(gòu)和壓縮算法是不夠的，還要考慮壓實（Compaction）效率，如果還要兼顧算力消耗、IO延時和代碼復(fù)雜度等指標(biāo)，工程難度將指數(shù)級提升。

針對這個場景，支持透明壓縮的計算型存儲 CSD2000，將壓縮解壓縮算法offload到盤內(nèi)FPGA，使計算更靠近數(shù)據(jù)存儲的地方（“in-situ computing”），進(jìn)一步縮短數(shù)據(jù)路徑，從而提升數(shù)據(jù)處理的效率。

對比“軟”壓縮（基于CPU）和硬壓縮（基于FPGA）兩者的收益并不復(fù)雜，下面以MySQL為例，將MySQL頁壓縮，MySQL表壓縮和CSD2000透明壓縮三者進(jìn)行對比，采用TPC-C和TPC-E數(shù)據(jù)集和負(fù)載模型，以壓縮率和數(shù)據(jù)庫性能（TPS和時延）為指標(biāo)衡量壓縮效率。

先看壓縮率，計算型存儲 CSD2000 提供更高的壓縮率，幾乎是MySQL自帶壓縮的2倍以上，如下所示：

再看性能，使用sysbench測試1/4/16/64/256/512并發(fā)下性能表現(xiàn)，可以觀察到（如下圖所示）：

≥ 64并發(fā)時，CSD2000 QPS/TPS平均提高~5倍，最高提高~12倍，99%平均時延降低68%以上；

《64并發(fā)時，CSD2000 QPS/TPS普遍高于普通NVMe SSD 20%~50%，99%平均時延降低8%~45%；

說明：為了便于對比，以普通NVMe SSD指標(biāo)為基線做歸一化。

Mark Callaghan （Facebook Distinguished Engineer）曾經(jīng)吐槽在數(shù)據(jù)庫中實現(xiàn)透明頁壓縮并應(yīng)用在生產(chǎn)環(huán)境，工程實現(xiàn)過于復(fù)雜，難怪Jens Axboe（Linux內(nèi)核代碼主要貢獻(xiàn)者之一，F(xiàn)IO和IO_URING的作者）建議他把這些工作丟給計算型存儲公司 ScaleFlux。而從計算型存儲帶來的壓縮及性能（詳見：可計算存儲：數(shù)據(jù)壓縮和數(shù)據(jù)庫計算下推）收益來看已經(jīng)超額完成任務(wù)。

計算型存儲和文件系統(tǒng)

壓縮同時減少數(shù)據(jù)寫入量（Nand Written）和寫放大（Write Amplification），但實際的情況會更復(fù)雜一些，大多數(shù)情況下數(shù)據(jù)庫運行在文件系統(tǒng)之上。

以日志型文件系統(tǒng)ext4為例，設(shè)計以下測試驗證日志寫入量與數(shù)據(jù)庫數(shù)據(jù)寫入量的比例及透明壓縮對于減少寫入量的收益：

選用 MySQL 和 MariaDB；

200GB數(shù)據(jù)集；

3種負(fù)載模型：Insert/Update-Index/Update-Non-Index；

兩種數(shù)據(jù)訪問方式：熱點集中（Non-uniform Key Distribution）和全隨機（Uniform Key Distribution）；

最終測試結(jié)果如下：

因為文件系統(tǒng)的 WAL（Write Ahead Log）機制，加上日志的稀疏結(jié)構(gòu)，日志寫入量占整體寫入量20%~90%，可見文件系統(tǒng)日志寫入量可能大于上層應(yīng)用（數(shù)據(jù)庫）的數(shù)據(jù)寫入量；

透明壓縮對于減少數(shù)據(jù)庫數(shù)據(jù)量的寫入效果明顯，對于減少日志系統(tǒng)寫入量的效果更加顯著，全部測試場景減少日志寫入量約4~5倍；

說明：以普通NVMe SSD指標(biāo)為基線做歸一化，直方圖面積越小，數(shù)據(jù)寫入量越少。

人類的智慧注定都要在山頂相遇

亞馬遜經(jīng)常談?wù)搯蜗颍╫ne-way）和雙向（two-way）門決策。雙向門決策容易逆轉(zhuǎn)，例如A/B test，這類決策可以快速采取行動，即使失敗，成本也不高。單向門決策大多數(shù)時候不可撤銷，必須”大膽假設(shè)，小心求證“。Nitro 顯而易見是一個單向（one-way）門決策，即便是2012年開始，AWS也花了足足7年時間才完整落地。

在異構(gòu)計算領(lǐng)域，頭部云計算廠已經(jīng)達(dá)成共識，相關(guān)產(chǎn)品也加速推出，包括支持計算下推的阿里云PolarDB（詳見：可計算存儲：數(shù)據(jù)壓縮和數(shù)據(jù)庫計算下推），以及 AWS re:Invent2020 再次提到的基于 AUQA（Advanced Query Accelerator）節(jié)點加速的 Redshift。

風(fēng)物長宜放眼量，人類的智慧注定都要在山頂相遇。

責(zé)任編輯：haq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

存儲

存儲

+關(guān)注

關(guān)注
13

文章
4332

瀏覽量
85949
計算機

計算機

+關(guān)注

關(guān)注
19

文章
7519

瀏覽量
88221
AWS

AWS

+關(guān)注

關(guān)注
0

文章
432

瀏覽量
24405

【一文看懂】什么是異構(gòu)計算？

隨著人工智能、深度學(xué)習(xí)、大數(shù)據(jù)處理等技術(shù)的快速發(fā)展，計算需求的復(fù)雜性不斷提升。傳統(tǒng)的單一計算架構(gòu)已難以滿足高效處理復(fù)雜任務(wù)的要求，異構(gòu)計算因此應(yīng)運而生，成為現(xiàn)代計算領(lǐng)域的

發(fā)表于 12-04 01:06 ?1583次閱讀

【<b class='flag-5'>一</b>文看懂】什么是<b class='flag-5'>異構(gòu)計算</b>？

詳解Arm計算平臺的優(yōu)勢

對于人工智能 (AI) 而言，任何單一硬件或計算組件都無法成為適合各類工作負(fù)載的萬能解決方案。AI 貫穿從云端到邊緣側(cè)的整個現(xiàn)代計算領(lǐng)域，為了滿足不同的 AI 用例和需求，一

發(fā)表于 12-03 16:53 ?333次閱讀

一文詳解計算型存儲協(xié)議框架

側(cè)，稱為計算型存儲（Computational Storage），通過存儲側(cè)卸載數(shù)據(jù)預(yù)處理，如數(shù)據(jù)校驗、解壓、數(shù)據(jù)提取，甚至卸載局部機器學(xué)習(xí)訓(xùn)練，從而減輕

發(fā)表于 10-31 14:20 ?447次閱讀

<b class='flag-5'>一</b>文詳解<b class='flag-5'>計算</b><b class='flag-5'>型</b><b class='flag-5'>存儲</b>協(xié)議框架

計算機存儲系統(tǒng)的工作原理和功能

計算機存儲系統(tǒng)作為計算機系統(tǒng)中至關(guān)重要的組成部分，其原理和功能對于理解計算機的運行機制具有關(guān)鍵意義。以下將詳細(xì)闡述

發(fā)表于 09-26 16:42 ?1099次閱讀

計算機存儲系統(tǒng)的構(gòu)成

計算機存儲系統(tǒng)是計算機中用于存放程序和數(shù)據(jù)的設(shè)備或部件的集合，它構(gòu)成了計算機信息處理的基礎(chǔ)。一個

發(fā)表于 09-26 15:25 ?1123次閱讀

使用tSPI協(xié)議減少下一個多電機BLDC設(shè)計的布線

電子發(fā)燒友網(wǎng)站提供《使用tSPI協(xié)議減少下一個多電機BLDC設(shè)計的布線.pdf》資料免費下載

發(fā)表于 09-26 10:40 ?0次下載

使用tSPI協(xié)議減少<b class='flag-5'>下一個</b>多電機BLDC設(shè)計的布線

澎峰科技高性能計算庫PerfIPP介紹

PerfIPP是專為計算機視覺處理和信號處理設(shè)計的優(yōu)化計算庫，計算驅(qū)動層基于OpenCL標(biāo)準(zhǔn)，支持異構(gòu)計算加速。

發(fā)表于 09-02 17:39 ?384次閱讀

澎峰科技高性能<b class='flag-5'>計算</b>庫PerfIPP介紹

淺談國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應(yīng)用場景

關(guān)于國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的具體優(yōu)勢和應(yīng)用場景淺談如下: 優(yōu)勢 異構(gòu)計算能力： 異構(gòu)雙核設(shè)計結(jié)合了RISC-V的高效指令集和FPGA的靈活可編程性，能夠針對特定

發(fā)表于 08-31 08:32

打造異構(gòu)計算新標(biāo)桿！國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計

參考設(shè)計是首個支持異構(gòu)計算架構(gòu)的CXL硬件設(shè)備，標(biāo)志著CXL技術(shù)在數(shù)據(jù)中心領(lǐng)域迎來異構(gòu)計算新階段。 ? 國數(shù)集聯(lián)基于FPGA與自主研發(fā)的CXL協(xié)議IP的先進(jìn)特性，可實現(xiàn)CPU、GPU、DDR、SSD

發(fā)表于 08-06 14:19 ?337次閱讀

打造<b class='flag-5'>異構(gòu)計算</b>新標(biāo)桿！國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計

AvaotaA1全志T527開發(fā)板AMP異構(gòu)計算簡介

Avaota SBC 的部分平臺內(nèi)具有小核心 CPU，與大核心一起組成了異構(gòu)計算的功能。在異構(gòu)多處理系統(tǒng)中，主核心和輔助核心的存在旨在共同協(xié)作，以實現(xiàn)更高效的任務(wù)處理。這種協(xié)作需要系統(tǒng)采取一

發(fā)表于 07-24 09:54

異構(gòu)計算：解鎖算力潛能的新途徑

在這個數(shù)據(jù)爆炸的時代，計算力是推動社會與科技創(chuàng)新的核心。從日常智能設(shè)備的流暢運行到超級計算機的尖端模擬，均依賴強大的計算能力。但面對多樣化的復(fù)雜計算任務(wù)，單

發(fā)表于 07-18 08:28 ?7945次閱讀

智能時代的路，將由異構(gòu)計算鋪就

AI時代，在計算支持領(lǐng)域，云計算、邊緣計算等相繼崛起，我們能看到的算力形態(tài)逐漸多樣化。同時，在我們看不到的地方，算力需求依然旺盛。隨著“十四五”規(guī)劃的不斷落地，加快數(shù)字化發(fā)展，打造具有國際競爭

發(fā)表于 07-03 08:28 ?250次閱讀

接地探針如何計算

安培數(shù)計算：對于每1A的電流（四舍五入到下一個最高整數(shù)），需要一個探針。

發(fā)表于 04-29 09:39 ?728次閱讀

高通NPU和異構(gòu)計算提升生成式AI性能?

異構(gòu)計算的重要性不可忽視。根據(jù)生成式AI的獨特需求和計算負(fù)擔(dān)，需要配備不同的處理器，如專注于AI工作負(fù)載的定制設(shè)計的NPU、CPU和GPU。

發(fā)表于 03-06 14:15 ?835次閱讀

如何評價智能車載異構(gòu)計算芯片性能？

車企不斷的宣傳讓我們知道了芯片的重要性。那么在智能駕駛領(lǐng)域里，到底什么是重要的呢，評估面向自動駕駛的計算芯片性能時，有沒有什么科學(xué)的依據(jù)呢？

發(fā)表于 01-25 12:45 ?766次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

計算型存儲：異構(gòu)計算的下一個關(guān)鍵應(yīng)用

評論

【一文看懂】什么是異構(gòu)計算？

詳解Arm計算平臺的優(yōu)勢

一文詳解計算型存儲協(xié)議框架

計算機存儲系統(tǒng)的工作原理和功能

計算機存儲系統(tǒng)的構(gòu)成

使用tSPI協(xié)議減少下一個多電機BLDC設(shè)計的布線

澎峰科技高性能計算庫PerfIPP介紹

淺談國產(chǎn)異構(gòu)雙核RISC-V+FPGA處理器AG32VF407的優(yōu)勢和應(yīng)用場景

打造異構(gòu)計算新標(biāo)桿！國數(shù)集聯(lián)發(fā)布首款CXL混合資源池參考設(shè)計

AvaotaA1全志T527開發(fā)板AMP異構(gòu)計算簡介

異構(gòu)計算：解鎖算力潛能的新途徑

智能時代的路，將由異構(gòu)計算鋪就

接地探針如何計算

高通NPU和異構(gòu)計算提升生成式AI性能?

如何評價智能車載異構(gòu)計算芯片性能？

搜索歷史

計算型存儲： 異構(gòu)計算的下一個關(guān)鍵應(yīng)用

評論

計算型存儲：異構(gòu)計算的下一個關(guān)鍵應(yīng)用