NVIDIA 計算架構團隊和NVIDIA 計算專家團隊正在熱招!
如果你對加速計算領域充滿熱情,并且希望與優秀的技術專家一起合作,那么這個機會將是你展現才華的優質平臺,快來加入!
NVIDIA 計算架構團隊
熱門崗位:
簡歷請投遞至:
sh-recruitment@nvidia.com
Deep Learning Performance Architect - Triton / LLM - TensorRT
工作內容:圍繞深度學習端到端 AI 軟件全棧,包括但不限于:訓練框架、核心計算庫、推理優化工具(比如 TensorRT)、AI 編譯器、模型壓縮等全棧軟件棧,以及可以在 AI 軟件全棧基礎上影響到下一代甚至下兩代硬件架構的特性設計。
技能要求: 良好 C++ 編程,熟悉 AI 軟件棧底層或者計算機體系結構,熟悉上層算法與 Python 是加分項。
工作地點:北京 / 上海
Deep Learning Performance Architect - TensorRT
工作內容:NVIDIA 深度學習推理引擎 TensorRT 的設計、開發和維護工作(比如,TensorRT 模型導入的流程和相關工具,圖優化,算子的 CUDA 實現及代碼生成,算子性能優化等),以及對當前主流的深度學習模型使用 TensorRT 進行推理的性能進行分析和優化。同時,還將與 NVIDIA GPU 體系結構設計團隊合作,來推動 NVIDIA 深度學習解決方案的軟硬件協同設計和研發。
技能要求:熟練掌握 C++ 編程。
加分技能 / 經驗: 深度學習框架 / 深度學習編譯器開發,性能分析 / 建模 / 優化相關的方法論 / 工具,計算機體系結構相關知識,CUDA kernel 開發 / 優化。
工作地點:上海 / 北京
Deep Learning Performance Architect - Operator
工作內容:針對不同 GPU 架構為 TensorRT、cuDNN、cuBLAS2、cuSPARSE 等深度學習算子庫提供高性能基礎算子以及算子融合實現,包含在線代碼生成,代碼融合等相關開發工作,以及根據當代 GPU 優化瓶頸影響后續硬件架構特征設計和驗證工作。
技能要求:良好 C++ 編程、熟悉計算機體系結構,有 TVM、MLIR 相關開發經驗是加分項。
工作地點:上海 / 北京
Deep Learning Performance Architect
工作內容:圍繞運算架構的全棧優化,包括但不限于:深度學習模型分析與預測、架構的性能分析、編譯器性能分析,以及對主流運算架構和軟件生態的分析。使 NVIDIA 軟件生態與計算架構更好的支持主流應用。
技能要求:良好 C++ / Python 編程,熟悉 AI 軟件或者計算機體系結構。
工作地點:上海
上下滑動查看更多職位詳情
團隊介紹
算力是 AI 時代的基礎設施,而“后摩爾定律時代”,軟硬件協同設計,才是加速計算的未來!
NVIDIA 計算架構團隊歷經 CUDA 并行編程模型從起步至今的所有階段,其間參與了數代通用 GPU 計算架構及之上的包括 cuDNN、TensorRT、底層高性能算子、并行編程語言在內的加速軟件棧的研發工作。該團隊同時參與關鍵機器學習模型的算法及框架優化。
目前,該團隊開放多個職位等你的加入!與我們共同書寫下一代 AI 計算架構的未來!
NVIDIA 計算架構團隊旨在推動算法、并行編程模型、核心加速軟件庫及 GPU 體系結構的協同設計和演化,在高速發展的深度學習算法與 GPU 硬件體系結構之間建立橋梁,并研發先進的軟硬件協同的加速計算解決方案。
該團隊從高性能計算、深度學習、自動駕駛等計算應用領域出發,跟蹤學界、工業界前沿算法,并掌握其發展方向;通過對前沿算法(比如:神經網絡結構)的深入理解,分析并提出芯片架構的需求,包含指令集、編程模型、計算能力、訪存帶寬、片上存儲、片上網絡及網絡互聯等。
同時,承擔基于架構的計算加速軟件棧的開發及產品化工作。自底層加速核心算子開發及優化,基于硬件加速的并行編程模型的研發和編譯,TensorRT、cuDNN 等核心加速庫,直到上層訓練框架、編譯優化。以及,針對模型的混合精度、稀疏矩陣訓練及量化方法開發。
上下滑動查看更多詳情
團隊發展
該團隊基于硬件架構開發軟件、編程模型、算法實現,通過算法、軟件開發實踐反饋并推動硬件架構優化,形成閉環,最終實現軟件、編程模型及硬件架構的協同演化和迭代,達到極致計算加速的目標:
-
建立下一代芯片性能模型、搭建芯片性能分析平臺、調研下一代芯片新特性
-
研發及設計新的加速指令、開發原型代碼及編程模型、迭代優化下一代芯片架構
-
跟蹤下一代芯片新特性在應用中的落地實現(算子實現、編譯等)
-
開發集成最終軟件產品庫 - TensorRT,cuDNN
-
優化訓練框架(MLPerf 各項優化)
-
開發混合精度、稀疏矩陣及量化方法
上下滑動查看更多詳情
NVIDIA 計算專家團隊
熱門崗位:
簡歷請投遞至:
sh-recruitment@nvidia.com
Developer Technology Engineer
工作內容:
-
包括大語言模型、生成式 AI、推薦系統在內的深度學習、機器學習、數據分析領域新技術,以及編程實現、優化、模型、算法等方面的研究和開發;
-
工業界實際應用的深度分析和優化,以保證該類應用在當前和未來的 NVIDIA 架構上都能保持卓越性能;
-
為關鍵客戶(業界頭部公司)提供合適的 AI 解決方案;
-
和 GPU / CPU / DPU 架構團隊、研究團隊、應用庫和開發工具團隊、系統軟件團隊等緊密合作來影響下一代產品架構、軟件平臺和編程模式的設計與開發;
-
與世界各地的優秀同事一起助力深度學習技術在互聯網、交通、金融、醫療等各領域的落地。
基本要求:
-
計算機科學相關專業優秀碩士、博士畢業生;
-
擁有良好的 C / C++ / Python 編程能力,良好的軟件設計和開發能力;
-
(二選一)有并行計算編程基礎,有 CUDA / C / C++ / Python 編程經驗;
-
(二選一)擁有深度學習,機器學習領域的扎實理論基礎,熟悉常見的深度學習網絡或機器學習算法;
-
良好的溝通能力、解決問題能力、時間管理能力和任務優先級管理能力;
-
良好的英文技術文檔讀寫能力和日常聽說溝通能力。
工作地點:北京 / 上海 / 深圳 / 臺北
上下滑動查看更多職位詳情
團隊介紹
NVIDIA 計算專家團隊(DevTech)專注于各種深度學習算法、科學計算、數據分析和云端應用;在 NVIDIA 平臺上進行性能分析以及優化,以充分發揮 NVIDIA GPU / CPU / DPU,集群和數據中心強大的算力,使其達到,或者接近“光速”(SOL)水平的高級技術團隊。
該團隊與世界上技術領先的企業、高校、研究院所合作,共同推動和加速各項 AI 應用的落地。通過與用戶深度緊密的合作,在大語言模型、生成式 AI、推薦系統、自動駕駛、自然語言處理、視頻和圖像理解、語音識別與合成,游戲等領域取得了累累碩果。該團隊成為幫助客戶發揮硬件平臺和軟件棧綜合算力的中堅力量,能夠為產品研發團隊提供性能優化、設計原型和行業應用案例。
團隊目標:在 NVIDIA 系統上,將各類應用優化到性能極致!
以打造大語言模型(LLM)應用為例,既可以直接使用 NVAIE / NVIDIA Nemo Service,也可以使用應用框架(Nemo FW、Triton+TensorRT、FT等)來訓練和部署模型,也可以基于 cuDNN / TensorRT 等軟件庫自己開發自己的框架,還可以基于 CUDA 來完全定制化自己的 pipeline,或者也可以混合采用這些方法。
如何選擇一種合適的方法,其關鍵在于取得應用場景、性能要求、平臺靈活性、時間成本、技術成本之間的平衡。NVIDIA 計算專家團隊就是幫助客戶和 NVIDIA 解決這個問題的。
上下滑動查看更多詳情
團隊發展
團隊成員主要來自北京、上海、深圳、臺北、首爾等地。
科學計算時代,當整個市場都還只關注于不斷擴大通用硬件的規模時,NVIDIA 推出了加速計算 GPGPU 和 CUDA 編程模型。GPU 和 CUDA 這一全新的加速計算范式,為業界帶來了源源不斷的加速,但是也對應用的開發和優化提出了挑戰。
在不斷改進基礎庫性能的同時,NVIDIA 組建了一支特別團隊,關注更為具體的應用。團隊成員們不僅有深厚的計算機功底(從計算機體系結構、CUDA 編程,到編譯原理、網絡互連),還擁有各個領域的專業知識。這支團隊不但可以從 GPU 編程方面對程序進行優化,更能從算法、模型方面提出改進建議,這使得 NVIDIA GPU 從科學計算領域脫穎而出。
隨著深度學習的高速發展,該團隊也在續寫著相同的故事。對于 AI 中的神經網絡,從代碼和算法兩個方面對其進行優化。代碼方面涉及 CUDA、GPU 庫,多機多卡網絡互連等各個領域;而算法包括了模型壓縮、量化、剪枝、混合精度訓練、梯度壓縮等,其最終目標都是在模型精度沒有損失,或者損失不大的情況下,提高訓練和預測的速度。
對于一個基于 AI 的實際工業項目,除了神經網絡以外,系統內還包括了很多其他模塊,神經網絡在其中耗時只占 1/3 - 1/2。以互聯網核心的推薦系統為例,其包括了召回、過濾、粗排、精排、離線訓練、在線訓練、ETL、特征工程等模塊和流程。該團隊致力于提供全流程的參考解決方案,讓盡可能多的模塊運行在 GPU 上,進而為應用帶來顯著加速。
上下滑動查看更多詳情
點擊“閱讀原文”,或掃描下方海報二維碼,觀看 NVIDIA 創始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領域的最新進展!
-
英偉達
+關注
關注
22文章
3854瀏覽量
92076
原文標題:NVIDIA 招聘 | NVIDIA 最新熱招崗位!一起迎接未來加速計算!
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
利用NVIDIA DPF引領DPU加速云計算的未來

盤點NVIDIA 2024年的創新成果
《CST Studio Suite 2024 GPU加速計算指南》
NVIDIA加速全球大多數超級計算機推動科技進步

NVIDIA加速計算如何推動醫療健康
NVIDIA向開放計算項目捐贈Blackwell平臺設計
日本企業借助NVIDIA產品加速AI創新
利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

NVIDIA在加速計算和生成式AI領域的創新
借助NVIDIA超級計算機加速量子計算發展
英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務
HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革
NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革
NVIDIA 通過 CUDA-Q 平臺為全球各地的量子計算中心提供加速

評論