使用深度強化學習( Deep Reinforcement Learning )和 PyTorch 建立人工智慧 (AI) 代理:A2C、REINFORCE、DQN 等。
從這 10.5 小時的課程,你會學到
- 了解強化學習範例及其最適合解決的任務。
- 了解使用強化學習解決認知任務的過程
- 了解使用強化學習解決任務的不同方法並選擇最合適的方法
- 完全從頭開始實施強化學習演算法
- 從根本上理解每個演算法的學習過程
- Debug 和擴展所提出的演算法
- 從研究論文中理解並實作新演算法
要求
- 輕鬆使用 Python 進行程式設計
- 了解基本的線性代數和微積分(矩陣、向量、行列式、導數等)
- 了解基本統計和機率論(平均值、變異數、常態分佈等)
課程說明
這是 Udemy 上最完整的密集學習課程。在其中,您將學習強化學習的基礎知識,強化學習是現代人工智慧的三大典範之一。您將從頭開始實作自適應演算法,根據經驗解決控制任務。您還將學習將這些演算法與深度學習技術和神經網路結合,從而產生稱為深度強化學習的分支。
本課程將為您提供理解新演算法所需的基礎。它還將為您準備本系列的下一課程,在這些課程中,我們將更深入地研究強化學習的不同分支,並研究一些現有的最先進的演算法。
課程的重點是培養實用技能。因此,在學習了每個方法系列中最重要的概念之後,我們將從頭開始在 Jupyter Notebook 中實作一個或多個演算法。
本課程分為三個部分,涵蓋以下主題:
第 1 部分(表格方法):
- 馬可夫( Markov )決策過程
- 動態規劃
- 蒙特卡羅( Monte Carlo )方法
- 時差法(SARSA、Q-Learning)
- N步驟引導( N-step bootstrapping )
第 2 部分(連續狀態空間):
- 狀態聚合
- 貼磚編碼( Tile Coding )
第 3 部分(深度強化學習):
- 深度 SARSA
- 深度 Q 學習( Q-Learning )
- 加強( REINFORCE )
- Advantage Actor-Critic / A2C(優勢 Actor-Critic / A2C 方法)
目標受眾
- 想在機器學習領域找到工作的開發人員
- 尋求擴展知識廣度的資料科學家/分析師和機器學習從業者。
- 尋求提高實際編碼技能的研究人員/學者。
講師簡介
Escape Velocity Labs 實踐性全面的人工智慧課程
逃逸速度實驗室提供人工智慧和數據科學課程。這些課程旨在培養學生的實用技能並獲得在該領域工作所需的知識。該理論以簡單但嚴謹的方式教授。
該公司成立於 2019 年,除了創建線上培訓課程外,還為企業提供機器學習領域的諮詢服務。
字幕:英文
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
- Udemy 永久擁有課程 許多課程約 NT400(點擊連結看更多)
- ✨年訂閱每月 NT350 🌈 悠遊 Udemy 的 26000+ 門課,最大化學習 ( 原價 NT635/月 )
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程

也許你會有興趣
- Python 深度學習相關線上課程
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入
發表迴響