強化學習從初學者到精通 - Python 中的 AI

使用深度強化學習( Deep Reinforcement Learning )和 PyTorch 建立人工智慧 (AI) 代理：A2C、REINFORCE、DQN 等。

從這 10.5 小時的課程，你會學到

了解強化學習範例及其最適合解決的任務。
了解使用強化學習解決認知任務的過程
了解使用強化學習解決任務的不同方法並選擇最合適的方法
完全從頭開始實施強化學習演算法
從根本上理解每個演算法的學習過程
Debug 和擴展所提出的演算法
從研究論文中理解並實作新演算法

要求

輕鬆使用 Python 進行程式設計
了解基本的線性代數和微積分（矩陣、向量、行列式、導數等）
了解基本統計和機率論（平均值、變異數、常態分佈等）

課程說明

這是 Udemy 上最完整的密集學習課程。在其中，您將學習強化學習的基礎知識，強化學習是現代人工智慧的三大典範之一。您將從頭開始實作自適應演算法，根據經驗解決控制任務。您還將學習將這些演算法與深度學習技術和神經網路結合，從而產生稱為深度強化學習的分支。

本課程將為您提供理解新演算法所需的基礎。它還將為您準備本系列的下一課程，在這些課程中，我們將更深入地研究強化學習的不同分支，並研究一些現有的最先進的演算法。

課程的重點是培養實用技能。因此，在學習了每個方法系列中最重要的概念之後，我們將從頭開始在 Jupyter Notebook 中實作一個或多個演算法。

本課程分為三個部分，涵蓋以下主題：

第 1 部分（表格方法）：

馬可夫( Markov )決策過程
動態規劃
蒙特卡羅( Monte Carlo )方法
時差法（SARSA、Q-Learning）
N步驟引導( N-step bootstrapping )

第 2 部分（連續狀態空間）：

狀態聚合
貼磚編碼( Tile Coding )

第 3 部分（深度強化學習）：

深度 SARSA
深度 Q 學習( Q-Learning )
加強( REINFORCE )
Advantage Actor-Critic / A2C（優勢 Actor-Critic / A2C 方法）

目標受眾

想在機器學習領域找到工作的開發人員
尋求擴展知識廣度的資料科學家/分析師和機器學習從業者。
尋求提高實際編碼技能的研究人員/學者。

講師簡介

Escape Velocity Labs 實踐性全面的人工智慧課程

逃逸速度實驗室提供人工智慧和數據科學課程。這些課程旨在培養學生的實用技能並獲得在該領域工作所需的知識。該理論以簡單但嚴謹的方式教授。

該公司成立於 2019 年，除了創建線上培訓課程外，還為企業提供機器學習領域的諮詢服務。

字幕：英文

想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To

Udemy 永久擁有課程許多課程約 NT400 (點擊連結看更多)
✨年訂閱每月 NT350 ( ⏳首年再享 30％off ) 🌈 悠遊 Udemy 的 26000+ 門課，最大化學習 ( 原價 NT635/月 )
Udemy 現在越來越多課程有中文字幕，請參考 Soft & Share 中文線上課程
手機上點選優惠連結看到的價格比電腦上看到的貴
＄代表當地貨幣, 如在台灣為 NT
點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上，請稍等刷新或重新點選就會出現

報名參加課程

也許你會有興趣

Python 深度學習相關線上課程
★英語學習地圖 – 練好英文是最大的學習槓桿
如何找工作學習地圖 – 找工作不要靠運氣！
從 Soft & Share 各種社團頻道挑選你喜歡的加入

強化學習從初學者到精通 – Python 中的 AI

從這 10.5 小時的課程，你會學到

要求

課程說明

目標受眾

講師簡介

字幕：英文

報名參加課程

也許你會有興趣

不受 FB 演算法影響，歡迎透過 e-mail 訂閱網站更新

請按讚：

相關

發表迴響取消回覆

透過電子郵件關注網誌

近期文章

從這 10.5 小時的課程，你會學到

要求

課程說明

目標受眾

講師簡介

字幕：英文

報名參加課程

也許你會有興趣

不受 FB 演算法影響，歡迎透過 e-mail 訂閱網站更新

分享此文

請按讚：

相關

發表迴響取消回覆

透過電子郵件關注網誌

近期文章

探索更多來自 Soft & Share 的內容