[電子書] CUDA for Deep Learning

CUDA(Compute Unified Device Architecture,統一運算設備架構)提供了一個強大的平行程式設計模型,AI 工程師可以利用它來充分發揮 NVIDIA GPU 的強大處理能力。 CUDA 能夠在 GPU 層級提供其他最佳化方式無法比擬的直接控制、偵錯能力和加速。

MEAP 計畫於2026年1月啟動,最後更新於2026年1月,預計2026年夏季出版。

《CUDA 深度學習》一書將向您展示如何在 CUDA 生態系統中運作,從編寫第一個核心到實現諸如 Flash Attention 等進階 LLM 功能。您將學習如何使用 Nsight Compute 進行效能分析,識別瓶頸,並理解每項優化背後的原理。透過解決多層次抽象的問題,您將深入理解 CUDA,並掌握核心建構的實用技能。本書針對最新的 NVIDIA 硬體編寫,旨在幫助您深入理解 CUDA 基礎知識,這些知識將隨著晶片的升級和發展而保持其重要性。

內容包含

  • 56 個可用於模型的內核
  • 用於整合自訂核心的 PyTorch C++ 擴充管道
  • 充分利用 NVIDIA GPU 的高階特性(Ampere、Hopper、Blackwell)
  • 從零開始建立反向傳播演算法,最終產生單一檔案 MNIST MLP 模型。

目標讀者

針對熟悉 C/C++ 的軟體和人工智慧工程師。無需 CUDA 經驗。

關於作者

Elliot Arledge 為 FreeCodeCamp 創建了 12 小時的 CUDA 課程和 6 小時的 LLM 從零開始課程,並提供深度學習表現的諮詢服務。

關於 MEAP 搶鮮電子書

一本書可能需要一年或更長的時間才能寫出來,那麼你今天如何學習熱門新技術? 答案是MEAP,即 Manning Early Access 計劃。 在 MEAP 中,你可以逐次閱讀章節方式閱讀一本書當書還在進行撰寫中,一旦完成,即可獲得最終的電子書。 如果您預訂 pBook,你可以在上架到商店之前用很久。

更詳細的 MEAP 請參考 MEAP 說明


購買書籍網址 | 今日特價書

Sponsored by Mannning


也許你會有興趣

不受 FB 演算法影響,歡迎透過 e-mail 訂閱網站更新

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

由 WordPress.com 建置.

Up ↑

探索更多來自 Soft & Share 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading