掌握使用 CUDA 進行 GPU 平行程式設計:(硬體與軟體)

高效能運算的效能最佳化與分析

從這 23 小時的課程,你會學到

  • 全面理解 GPU 與 CPU 架構
  • 了解圖形處理單元 (GPU) 的歷史以及最新產品
  • 了解 GPU 的內部結構
  • 了解不同類型的記憶體及其對效能的影響
  • 了解 GPU 內部組件的最新技術
  • 了解 GPU 上 CUDA 程式設計的基礎知識
  • 開始在 Windows 和 Linux 上使用 CUDA 進行 GPU 編程
  • 了解最有效的平行化方法
  • 效能分析和調優
  • 利用共享記憶體

要求

  • C 和 C++ 基礎
  • Linux 和 Windows 基礎
  • 電腦體系結構基礎

課程說明

本實作課程將教您如何利用 CUDA 釋放現代 GPU 強大的平行處理能力。您將從 GPU 硬體的基礎知識入手,追溯旗艦架構(Fermi → Pascal → Volta → Ampere → Hopper)的演變,並透過程式設計實驗室學習如何編寫、分析和優化高效能核心。

這是一個獨立的培訓資源,並非由 NVIDIA Corporation 贊助、認可,也不與其有任何關聯。 「CUDA」、「Nsight」及其架構代號均為 NVIDIA 的商標,此處僅作為事實參考。

您將掌握的內容

  • GPU 與 CPU 的基礎知識-為何 GPU 在資料平行工作負載中佔據主導地位。
  • 代際設計進步-對效能最重要的硬體特性。
  • CUDA 工具包安裝-Windows、Linux 和 WSL,以及首次執行的健全性檢查。
  • 核心 CUDA 概念-執行緒、區塊、網格和記憶體層次結構,並透過向量加法等實驗建構而成。
  • 使用 Nsight Compute / nvprof 進行效能分析和調優—測量佔用率、隱藏延遲並突破瓶頸。
  • 矩陣的二維索引-為實際的線性代數任務編寫高效的內核。
  • 最佳化方案-處理非 2 的冪次方資料、利用共享記憶體、最大化頻寬並最小化 Warp 發散。
  • 強大的偵錯和錯誤處理-使用執行時間 API 檢查來交付可用於生產的程式碼。

完成本課程後,您將能夠設計、分析和微調在當今 GPU 上高效運行的 CUDA 核心,從而能夠應對嚴苛的科學、工程和 AI 工作負載。

目標受眾

對於任何對 GPU 和 CUDA 感興趣的人,例如工程專業的學生、研究人員和其他任何人

講師簡介

Hamdy egy 研究助理

我是一名博士。學生。我於2012年從電腦與系統工程系畢業,當時的成績是全班第二名。我還於2019年完成了航空航太和人工智慧領域的碩士學位。在master中,我建立了一個模型來偵測溫度控制子系統中的故障,然後預測新值而不是故障值。該模型有助於自動發現一些人類專家難以發現的故障和錯誤。

我還擔任了 5 年的嵌入式系統講師。

字幕:英文

  • 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To

  • Udemy 永久擁有課程 課程特價中 約 NT350 (點擊連結看更多)
  • 年訂閱每月 NT350 🌈 悠遊 Udemy 的 26000+ 門課,最大化學習 ( 原價 NT635/月 )
  • Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
  • 手機上點選優惠連結看到的價格比電腦上看到的貴
  • $代表當地貨幣, 如在台灣為 NT
  • 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現

報名參加課程

Sponsored by Udemy


也許你會有興趣

不受 FB 演算法影響,歡迎透過 e-mail 訂閱網站更新

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

由 WordPress.com 建置.

Up ↑

探索更多來自 Soft & Share 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading