在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何使用GPU編程優化模型/代碼

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-10 11:32 ? 次閱讀

雖然世界在不斷變化,但開發人員仍在不斷推動他們使用創新技術應對挑戰。最近的臺灣計算云( TWCC ) GPU Hackathon 就是這樣一個例子,它是開發者和工程師使用 GPU 推進 HPC 和 AI 項目的催化劑。

國家高性能計算中心 、 臺灣網絡服務公司 、 NVIDIA 和 OpenACC 、 12 個團隊和 15 名 NVIDIA 導師之間的合作,使用了從人工智能驅動的制造調度模型到快速洪水預測模型的各種方法來加速項目。

利用人工智能優化生產效率

智能制造的關鍵領域之一是優化和自動化生產線流程。團隊 AI 調度員和 工業技術研究中心(工研院) 的 計算智能技術中心( CITC ) 成員來到 hackathon ,使用機器學習開發他們的制造調度模型。

傳統的調度模型大多采用啟發式規則,能夠即時響應動態事件。然而,他們的短期方法通常不會帶來最佳解決方案,并且在處理變化的變量時被證明是不靈活的,這限制了他們的持續生存能力。

該團隊的方法使用蒙特卡羅樹搜索( MCTS )方法,將經典的樹搜索實現與強化學習的機器學習原理結合起來。該方法解決了現有的啟發式限制,提高了整體調度模型的效率,提高了效率。

通過與導師合作,團隊 AI Scheduler 學會了使用 NVIDIA Nsight 系統 來識別瓶頸,并使用 GPU 來并行化代碼?;顒咏Y束時,團隊能夠加快 MCTS 算法模擬步驟。這將調度時間從 6 小時減少到 30 分鐘,并使總體調度效率提高了 11.3 倍。

工研院 CITC 的曾正蘇博士和黃浩哲博士說:“在本次黑客大會上證明了使用 GPU 加速我們的模型的可行性之后,下一步是將其應用到我們的商業模型中,供工業使用?!薄?/p>

使用 GPU 了解地球科學的全局

臺灣位于歐亞大陸和菲律賓海板塊之間,是世界上構造最活躍的地區之一,也是全球地震研究的重要基地。地質研究和構造活動的時間尺度通常以數千年或數萬年為單位。這需要使用大量數據和足夠的計算能力來進行有效分析。

由 中央研究院地球研究所 的譚博士領導的 IES 地球動力學團隊來到 GPU Hackathon 加速他們的數值地球動力學模型。它名為 DynEarthSol ,模擬地幔對流、俯沖、造山和構造。此前,該團隊通過將數據分塊并限制計算過程以適應 CPU 有限的計算能力來減少計算和步驟的數量,從而處理大量數據。這使得很難看到研究的全貌。

pYYBAGJST-SAa2tjAASPieycVq8900.png

圖 2 俯沖帶的動畫模擬。

在黑客競賽的過程中,團隊使用了一種新的數據輸入方法,利用 GPU 計算數據和多個步驟。使用 OpenACC , IES 地球動力學團隊能夠將 80% 的模型移植到 GPU ,并實現了 13.6 倍的加速。

“這是我第二次參加 GPU 黑客競賽,我肯定會參加下一次,”中央研究院國際研究所研究員譚恩恩教授說。“我們已經學會了采用 GPU 的適當方法,用戶友好的分析工具為我們提供了一個優化模型的好主意。”

該團隊將繼續致力于移植其模型的剩余 20% 。他們期待使用 GPU 運行更多高分辨率模型,以更深入地了解臺灣的編隊活動。

用于應急規劃和響應的快速洪水評估

洪水是最具破壞性的自然災害之一。每年造成大量人員傷亡和經濟損失, 全世界平均有 2100 萬人受洪水影響 ,由于氣候變化和其他因素,預計人數還會增加。預防和減輕這些危害是一項關鍵工作。

來自 國立楊橋大學( NYCU ) 的 THINKLAB 團隊正在開發一種模型,該模型可以為緊急情況提供快速準確的結果,同時保持操作的簡單性。所提出的 混合淹沒模型( HIM ) 通過元胞自動機方法求解零慣性方程,并與亞網格級插值策略配合使用,以生成更高分辨率的結果。

Picture5.gif

圖 3 HIM 產生的洪水范圍示例。

使用 Python 和 NumPy 庫開發的 HIM 模型在 hackathon 開始時沒有并行或 GPU 計算。在活動期間, THINKLAB 團隊使用 CuPy 為了使他們的代碼在 GPU 上并行運行,然后重點將用戶定義的 CUDA 內核應用于參數。結果是 672 倍加速,計算時間從 2 周縮短到大約 30 分鐘。

THINKLAB 團隊成員 Obaja Wijaya 說:“我們在這次活動中學到了很多技巧,并向其他人強烈推薦這些活動?!??!癗VIDIA 是這一領域的專家,通過與他們的導師合作,我們學會了如何使用 GPU 編程優化模型/代碼?!?/p>

關于作者

Izumi Barker 是 NVIDIA GPU 黑客競賽和訓練營的項目經理,也是 OpenACC Standard 的公關總監。組織。在這些角色之前,她在鳳凰城大學、 CeCon 集團、囊性纖維化基金會和 LLP 安永等高等教育、生命科學、技術和出版行業的公司舉辦了戰略營銷和傳播職位。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4742

    瀏覽量

    128976
  • python
    +關注

    關注

    56

    文章

    4797

    瀏覽量

    84739
  • CUDA
    +關注

    關注

    0

    文章

    121

    瀏覽量

    13641
收藏 人收藏

    評論

    相關推薦

    探索AIGC未來:CPU源碼優化、多GPU編程與中國算力瓶頸與發展

    近年來,AIGC的技術取得了長足的進步,其中最為重要的技術之一是基于源代碼的CPU調優,可以有效地提高人工智能模型的訓練速度和效率,從而加快了人工智能的應用進程。同時,多GPU編程技術
    的頭像 發表于 12-08 11:49 ?1585次閱讀
    探索AIGC未來:CPU源碼<b class='flag-5'>優化</b>、多<b class='flag-5'>GPU</b><b class='flag-5'>編程</b>與中國算力瓶頸與發展

    優化模型與Lindo/Lingo優化軟件

    優化模型與Lindo/Lingo優化軟件 優化模型簡介 LINDO公司的主要軟件產品及功能簡介 LINDO軟件
    發表于 09-15 12:22

    【招聘】算法、圖像檢索、嵌入式、測試、架構、GPU優化等職位(bj&sh)

    。 2、熟悉NVIDIA或AMD GPU體系結構和代碼優化技術。 3、熟練使用CUDA或者OpenCL編程。 芯片驗證工程師 Responsibilities: - Develop
    發表于 02-28 14:23

    GPU編程的平臺模型、執行模型、內存模型編程模型

    GPU編程--OpenCL四大模型
    發表于 04-29 07:40

    請問Mali GPU的并行化計算模型是怎樣構建的?

    Mali T604 GPU的結構是由哪些部分組成的?Mali T604 GPU編程特性有哪些?Mali GPU的并行化計算模型是怎樣構建的
    發表于 04-19 08:06

    在Ubuntu上使用Nvidia GPU訓練模型

    問題最近在Ubuntu上使用Nvidia GPU訓練模型的時候,沒有問題,過一會再訓練出現非??D,使用nvidia-smi查看發現,顯示GPU的風扇和電源報錯:解決方案自動風扇控制在nvidia
    發表于 01-03 08:24

    Mali GPU支持tensorflow或者caffe等深度學習模型

    好的Tensorflow或者Caffe模型部署到ARM平臺Mali-G71/72 GPU上運行,而不重新OpenCL編寫代碼,但沒有看見相關可行的資料。網上信息顯示tensorflow lit和caffe2Go可以部署到ARM,
    發表于 09-16 14:13

    Mali-Valhall系列GPU編程內核

    2018年起。當使用GPU優化應用程序時,至少有一個高級心理模型是有用的了解底層硬件的工作方式。了解預期性能也很有用以及它可能執行的不同類型操作的數據速率。在優化使用Mali時,了解塊
    發表于 08-02 16:38

    Keil C編譯器編程規則和代碼優化

    本內容介紹了Keil C編譯器編程規則和代碼優化,要實用好單片機就必須清楚它的內部結構組織結構,無論是在芯片的選擇還是代碼的編寫
    發表于 04-20 17:37 ?315次下載
    Keil C編譯器<b class='flag-5'>編程</b>規則和<b class='flag-5'>代碼</b><b class='flag-5'>優化</b>

    數據流編程模型優化

    提出了新的挑戰。針對數據流程序在分布式架構下所面臨的問題,設計并實現了數據流編程模型和分布式計算框架的結合在COStream的基礎上提出了面向Storm的編譯優化框架??蚣馨▋蓚€模塊:面向Storm的層次性任務劃分與調度,以及
    發表于 11-23 15:48 ?3次下載
    數據流<b class='flag-5'>編程</b><b class='flag-5'>模型</b><b class='flag-5'>優化</b>

    CUDA簡介: CUDA編程模型概述

    在 CUDA 編程模型中,線程是進行計算或內存操作的最低抽象級別。 從基于 NVIDIA Ampere GPU 架構的設備開始,CUDA 編程模型
    的頭像 發表于 04-20 17:16 ?3010次閱讀
    CUDA簡介: CUDA<b class='flag-5'>編程</b><b class='flag-5'>模型</b>概述

    使用NVIDIA數學庫加速GPU應用程序

      加速 GPU 應用程序的主要方法有三種:編譯器指令、編程語言和預編程庫。編譯器指令,例如 OpenACC a 允許您順利地將代碼移植到 GPU
    的頭像 發表于 10-10 15:11 ?7457次閱讀
    使用NVIDIA數學庫加速<b class='flag-5'>GPU</b>應用程序

    谷歌發布用于輔助編程代碼模型CodeGemma

    谷歌發布了用于輔助編程代碼模型 CodeGemma。CodeGemma 基于谷歌今年 2 月發布的輕量級開源大模型 Gemma,針對 Gemma 的兩個不同參數規模的版本 Gemm
    的頭像 發表于 04-17 16:07 ?706次閱讀
    谷歌發布用于輔助<b class='flag-5'>編程</b>的<b class='flag-5'>代碼</b>大<b class='flag-5'>模型</b>CodeGemma

    如何構建及優化GPU云網絡

    并從計算節點成本優化、集群網絡與拓撲的選擇等方面論述如何構建及優化GPU云網絡。
    的頭像 發表于 11-06 16:03 ?373次閱讀
    如何構建及<b class='flag-5'>優化</b><b class='flag-5'>GPU</b>云網絡

    Triton編譯器與GPU編程的結合應用

    優化,以及生成高效的并行執行計劃。 GPU編程的挑戰 GPU編程面臨的主要挑戰包括: 編程復雜性
    的頭像 發表于 12-25 09:13 ?227次閱讀
    主站蜘蛛池模板: 三级在线观看网站| 欧美成人免费全部观看天天性色 | 国模网站| 国产免费高清福利拍拍拍| 国产va免费精品观看| www.日本黄色| 午夜欧美精品久久久久久久| 天天干夜夜夜操| 久久国产午夜精品理论片34页| 国产午夜不卡在线观看视频666| 国产免费爽爽视频免费可以看| 国产黄mmd在线观看免费| 欧美国产黄色| 免费精品99久久国产综合精品| 一级特黄女毛毛片| 四虎亚洲精品| 可以免费观看的黄色网址| 国产papa| 日本在线视| 免费人成网ww777kkk手机| 男女交性视频免费播放| 天天寡妇色| 久久综合色视频| 在线视频影院| 国产黄色片一级| 免费看性| 色人在线| 高清色视频| 久久久久大香线焦| 5g成人影院| 天堂电影免费在线观看| 久久久久综合| 天天做天天爱夜夜爽女人爽宅| 成人福利在线视频| 狠狠色噜噜狠狠狠狠97老肥女| 色婷婷婷婷| 成人mv高清在线| 黑人黑粗硬视频| 2023av网站| 奇米成人影视| 欧美成人全部免费观看1314色|