在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA RAPIDS加速器v21.08的功能應用

星星科技指導員 ? 來源:NVIDIA ? 作者:Eric Rife ? 2022-04-20 14:58 ? 次閱讀

介紹

用于Apache Spark 的 RAPIDS 加速器 8 月版( 21.08 )現已發布。自 NVIDIA GTC 2020 首次發布以來,已經有很長時間了。我們在許多方面都有所改進,特別是在易用性方面, Apache Spark 應用程序的代碼更改很少甚至沒有。去年,該團隊一直專注于添加功能和持續改進性能。為了證明這一點,我們使用 NVIDIA 數據科學( NDS )基準測試了定期測量在 3000 ( 3 TB 未壓縮)的比例因子下的性能和功能。在此版本中,除了添加新功能外,我們非常自豪地在提高所有通過查詢的端到端速度和降低 NVIDIA EGX 服務器的總體擁有成本方面取得了進展。

基準更新

NVIDIA 決策支持( NDS )是我們對 Apache Spark 社區常用的行業標準數據科學基準的改編。 NDS 包含與行業標準基準測試 TPC-DS 相同的 105 個 SQL 查詢,但修改了數據集生成和執行腳本的部分。在 GTC 2021 更新中,有 95 個查詢通過。在 21.08 版本中,通過核心外分組方式、窗口排名和密集排名等新功能,我們已經能夠在 GPU 上運行所有 105 個查詢。

基準設置

比例因子 -3K (帶浮點數的 3TB 數據集)

Systems: 4x NVIDIA 認證 EGX 服務器

EGX 服務器硬件規格: 4-node Dell R740xd, each with (2) 24-core CPUs, 512GB RAM, HDFS on NVMe, (1) CX-6 Dx 25/100Gb NIC, 2x NVIDIA A30 GPU

CPU 硬件規格: 4-node dell r740xd , each with ( 2 ) 24-core CPU s , 512GB ram , hdfs on nvme ,( 1 ) cx-6 dx 25 / 100gb nic

軟件: RAPIDS 加速器 v21.08.0 、 cuDF 21.08.0 、 Apache Spark 3.1.1 、 UCX 1.10.1

pYYBAGJfrzaARpzXAAChsgig6dI213.png

圖 1 : EGX 服務器上的 NDS 查詢速度: GPU vs CPU 。

基于此版本,我們很高興地向大家展示,所有 105 個查詢現在都可以在 GPU 上運行,而無需任何代碼更改。

用于這些基準測試的基準服務器對于四臺沒有 GPU s 的服務器的成本略低于 170000 美元,而在每臺服務器中包含一臺 NVIDIA A100 GPU 的成本則低于 220000 美元。

簡單來說,基準 GPU 服務器的成本是 CPU 服務器的 1.29 倍。

如上圖所示(圖 1 ),超過 95 個查詢現在比 GPU 快 1.29 倍,因此運行起來更便宜。

GPU 上一些速度較慢的查詢目前正在解決中,我們正在不懈地努力改進這些查詢并提高總體速度。

用戶可以很容易地推斷出 GPU 的加速從 1x 到 18x 不等,因此建議用戶確認 GPU 的正確用例。

如果用戶不確定 GPU 的正確用例,鑒定工具將是一個方便的資產。有關鑒定工具的更多信息,請參閱以下章節。

分析和鑒定工具

分析與鑒定工具于 21.06 發布,獲得了用戶社區的積極反饋以及對新功能的要求。在 21.08 中,鑒定工具現在能夠處理 Apache Spark 2.x 版本生成的事件日志。該工具還將支持 AWS EMR 6.3.0 、 Google Dataproc 2. 0 、 Microsoft Azure Synapse 以及 DataRicks 7.3 和 8.2 運行時生成的事件日志。鑒定工具不再需要 Spark 運行時。用戶現在只需在機器上使用 Apache Spark 3.x JAR 即可使用鑒定工具。最新版本還具有選擇事件日志的新過濾功能。該工具還查找插件不支持的讀取數據格式和類型,并從分數中刪除這些格式和類型(基于 SQL Dataframe 操作中的總任務時間)。輸出將以簡潔的格式報告在終端上,對每個已處理事件日志的詳細分析將存儲為 csv 輸出。

新功能

此版本為數組和結構添加了更多功能。我們現在可以對多層結構數據類型進行聯合,也可以以拼花格式編寫數組數據類型。我們在現有的超前、滯后和行號功能中添加了秩和密集秩窗口功能。有了這一新增功能, RAPIDS 加速器現在可以支持 SQL 中最常用的窗口運算符。對于時間戳操作符,我們添加了對遺留時間戳的支持。使用此功能,用戶可以讀取 Spark 2.0 中支持的傳統時間戳格式。對于 Databricks 用戶,我們添加了在 GPU 中緩存數據的功能(所有其他平臺都支持這種功能)。

我們通過處理 GPU 內存溢出的數據集以進行分組和窗口操作,繼續改善用戶體驗。這一改進將節省用戶創建分區的時間,以避免 GPU 上出現內存不足錯誤。類似地, UCX 1.11 的采用改進了 RAPIDS Spark 加速洗牌管理器的錯誤處理。

關于作者

Eric Rife 是 NVDIA 數據科學公司的技術營銷經理。他是一名高級專業人員,擁有 25 年的管理和工程經驗,設計和管理全天候關鍵任務企業系統,包括 Unix / Linux / Windows 服務器、應用程序服務器和多 PB 存儲解決方案。他目前領導 NVIDIA 的工作,幫助基礎設施經理和數據科學家重新思考如何加快 AI 在企業業務應用中的應用。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 服務器
    +關注

    關注

    12

    文章

    9262

    瀏覽量

    85777
  • WINDOWS
    +關注

    關注

    4

    文章

    3554

    瀏覽量

    89013
收藏 人收藏

    評論

    相關推薦

    NVIDIA助力FinCatch開發智能投資輔助系統

    本案例中通過 NVIDIA GPU 和 RAPIDS 加速平臺,FinCatch 實現了投資研究流程的全面智能化,提升數據分析速度和準確性,幫助投資者快速獲取可操作的投資洞察。
    的頭像 發表于 01-07 09:23 ?192次閱讀

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創意加速器

    加速器
    龍智DevSecOps
    發布于 :2024年11月26日 13:42:47

    NVIDIA加速計算引入Polars

    Polars 近日發布了一款由 RAPIDS cuDF 驅動的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使數據科學家僅在一臺機器上就能實現在數秒內處理數億行數據。
    的頭像 發表于 11-20 10:03 ?264次閱讀
    將<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>計算引入Polars

    RAPIDS cuDF將pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當前已能夠為 950 萬 pandas 用戶帶來 GPU 加速,且無需修改代碼。
    的頭像 發表于 11-20 09:52 ?245次閱讀
    <b class='flag-5'>RAPIDS</b> cuDF將pandas提速近150倍

    AMD Alveo V80計算加速器網絡研討會

    歡迎參加本次網絡研討會,我們將深入探討 AMD Alveo V80 計算加速器如何幫助您處理高性能計算、數據分析、金融科技、網絡安全、存儲加速、AI 計算等領域的內存密集型工作負載。Alveo
    的頭像 發表于 11-08 09:35 ?235次閱讀

    貿澤開售適用于高性能計算應用的AMD Alveo V80加速器

    2024 年 9 月 25 日 – 專注于引入新品的全球電子元器件和工業自動化產品授權代理商貿澤電子 (Mouser Electronics) 即日起供應AMD的Alveo? V80計算加速器卡。該
    發表于 09-27 14:59 ?185次閱讀

    NVIDIA Parabricks v4.3.1版本的新功能

    會(ESHG)上發布,其加入了新的體細胞數據變異檢測功能,并將業內領先的工具升級到最新版本。這個版本是繼在 NVIDIA GTC 2024 大會上發布 Parabricks v4.3 之后推出的新版本。
    的頭像 發表于 09-10 10:22 ?413次閱讀
    <b class='flag-5'>NVIDIA</b> Parabricks <b class='flag-5'>v</b>4.3.1版本的新<b class='flag-5'>功能</b>

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

    DolphinDB 是一家高性能數據庫研發企業,也是 NVIDIA 初創加速計劃成員,其開發的產品基于高性能分布式時序數據庫,是支持復雜計算和流數據分析的實時計算平臺,適用于金融、電力、物聯網和零售等行業。
    的頭像 發表于 09-09 09:57 ?499次閱讀
    利用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>DolphinDB Shark平臺提升計算性能

    利用邊沿速率加速器和自動感應電平轉換

    電子發燒友網站提供《利用邊沿速率加速器和自動感應電平轉換.pdf》資料免費下載
    發表于 09-02 11:58 ?1次下載
    利用邊沿速率<b class='flag-5'>加速器</b>和自動感應電平轉換<b class='flag-5'>器</b>

    什么是神經網絡加速器?它有哪些特點?

    神經網絡加速器是一種專門設計用于提高神經網絡計算效率的硬件設備。隨著深度學習技術的快速發展和廣泛應用,神經網絡模型的復雜度和計算量急劇增加,對計算性能的要求也越來越高。傳統的通用處理(CPU
    的頭像 發表于 07-11 10:40 ?544次閱讀

    “白地板”方案,智算中心加速器

    明德源能白地板方案,智算中心加速器
    的頭像 發表于 06-21 11:54 ?825次閱讀

    NVIDIA將在今年第二季度發布Blackwell架構的新一代GPU加速器“B100”

    根據各方信息和路線圖,NVIDIA預計會在今年第二季度發布Blackwell架構的新一代GPU加速器“B100”。
    的頭像 發表于 03-04 09:33 ?1403次閱讀
    <b class='flag-5'>NVIDIA</b>將在今年第二季度發布Blackwell架構的新一代GPU<b class='flag-5'>加速器</b>“B100”

    家居智能化,推動AI加速器的發展

    電子發燒友網報道(文/黃山明)AI加速芯片,也稱為人工智能加速器(AI Accelerator),是一種專為執行機器學習和深度學習任務而設計的ASIC或定制化處理。在智能家居中,AI加速
    的頭像 發表于 02-23 00:18 ?4628次閱讀

    回旋加速器原理 回旋加速器的影響因素

    回旋加速器(Cyclotron)是一種用于加速帶電粒子的可再生粒子加速器。它的工作原理基于帶電粒子在恒定強磁場中的運動。本文將詳細介紹回旋加速器的原理以及影響因素。 一、回旋
    的頭像 發表于 01-30 10:02 ?4447次閱讀

    回旋加速器中粒子的最大動能與什么有關

    回旋加速器是一種用于加速粒子的裝置,通過不斷變化的磁場和電場來不斷加速粒子,使其達到極高的速度和能量。粒子的最大動能取決于幾個關鍵因素。 首先,回旋加速器的設計和性能對粒子的最大動能有
    的頭像 發表于 01-18 10:42 ?3452次閱讀
    主站蜘蛛池模板: 狠狠色噜噜狠狠狠狠97影音先锋| 日本亚洲欧美国产日韩ay高清| 1024手机在线观看你懂的| 国产特黄一级片| 日本a级在线| 一区二区视频在线| 依人成人| 天天躁夜夜躁| 男男np主受高h啪啪肉| 深爱激情五月婷婷| 狠狠的干狠狠的操| 国产自在自线午夜精品视频| 热九九精品| 亚洲第七页| 日韩操| 国产区精品高清在线观看| 欧美三级黄| 免费a网| 偷偷要色偷偷| 天天噜噜色| 日本久操| 国产一区二区丁香婷婷| 永久看片| 福利视频网址| 干干干日日日| 特黄aa级毛片免费视频播放| 亚洲成av人片在线观看无码| 在线观看国产日本| 一级做a爰片久久毛片免费看| 天堂社区在线观看| 久久黄色毛片| 国产免费成人在线视频| 午夜国产高清精品一区免费| 99久久精品99999久久| 日本69式xxx视频| 中文字幕11页| 欧美一欧美一区二三区性| 欧美成人免费| 91p0rn永久备用地址二| 国产伦精品一区二区| 很黄很暴力 很污秽的小说|