CUDA。 NVIDIA GPU 運算堆疊、平行程式設計、Google Colab、HPC、CPU 與 GPU 效能比較
從這 1.5 小時的課程,你會學到
- 使用 Google Colab 設定並驗證 GPU 程式設計環境
- 探索 CUDA 程式設計模型
- 正確配置線程、區塊和網格以執行向量加法等操作
- 計算一維和二維線程索引
- 使用 C/C++ 編寫、編譯和運行基本的 CUDA 內核
- 進行基準測試與效能分析-測量 CPU 與 GPU 的執行時間
要求
具備C/C++程式設計基礎知識
課程說明
本課程將帶您踏上使用 NVIDIA CUDA(目前應用最廣泛的平行程式設計平台)進行 GPU 加速運算的實作之旅。無論您是學生、工程師還是開發人員,您都將學習如何利用數千個 GPU 核心,實現遠超 CPU 的效能水準。
課程從 GPU 架構的基礎知識入手,逐步深入 CUDA 程式設計實務——理解執行緒、區塊、網格,以及如何在 GPU 硬體上有效率地對應運算任務。
您將學到什麼
- 為什麼 GPU 對高效能運算至關重要
- 整合 GPU 與獨立 GPU 的區別
- CUDA 是什麼以及它如何實現並行處理
- NVIDIA GPU 運算堆疊詳解-從硬體到軟體
- 了解運算能力及其對效能的影響
- CUDA 程式設計模型:主機執行與裝置執行
- 寫出你的第一個 CUDA 程式:Hello World
- 深入了解線程、程式碼區塊和網格
- 線程索引實作高效並行計算
- 透過實際範例比較 CPU 與 GPU 的效能
- 各階段的測驗鞏固關鍵概念
為什麼要選修這門課?
- 由擁有 GPU 訊號處理和人工智慧實戰經驗的專家授課
- 理論與 CUDA 程式實戰結合
- 學習並行思維,優化演算法效能
- 為人工智慧、科學計算、數據處理或圖形程式設計領域的職業生涯做好準備
目標受眾
- 即使您沒有(或不想配置)專用 GPU,這門課程也適合您。
- 您對 CUDA 生態系統充滿好奇,並希望使用 Colab notebook 來實踐核心、線程/區塊和效能分析。
- 您是嵌入式工程師,希望擴展您的 GPU 程式設計專業知識。
- 您掌握基本的 C/C++,並希望加速運算密集型任務(例如機器學習、訊號或影像處理、科學運算)。
- 您正在尋找一門簡潔易懂、適合初學者的課程,它將帶您從「為什麼要使用 GPU?」開始,逐步深入記憶體層次結構和同步概念,並提供真實的 CPU 與 GPU 基準測試。
講師簡介
Hamza Bashir CUDA/GPU優化教練-實際加速
我是 CUDA/GPU 培訓師和 DSP/無線工程師,致力於幫助開發者透過實用且以效能分析器為導向的工作流程,從 CPU 過渡到 GPU。在過去的 14 年多時間裡,我建立並優化了訊號處理和無線物理層演算法(LTE、NB-IoT、5G/NTN),並使用 C/C++/CUDA、cuBLAS/cuFFT 和 Nsight 工具加速了 AI/HPC 工作負載。
我的教學方式
- 先實驗,後分析:寫 → 測量 → 分析 → 最佳化
- 使用 Google Colab 進行零設定學習(無需本地 GPU)
- 簡短精煉的影片、可運行的 Jupyter Notebook 和實際的小型項目
你將建構什麼
- 你的第一個 CUDA 內核,包含正確的索引和網格步長
- CPU 與 GPU 基準測試,並設定實際的加速目標
- 可擴展到 AI/LLM、影像/訊號處理或 HPC 的基礎知識
字幕:英文
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
- Udemy 永久擁有課程 ⏳ 優惠✨NT310 起(點擊連結看更多)
- ✨年訂閱每月 NT350 🌈 悠遊 Udemy 的 26000+ 門課,最大化學習 ( 原價 NT635/月 )
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程

也許你會有興趣
- GPU 相關線上課程
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入
發表迴響