fbpx

深度強化學習 2.0

Contents

最聰明的深度 Q-Learning,政策梯度( Policy Gradient ), Actor Critic,和 DDPG 組合課程

從這 9.5 小時的課程,你會學到

  • Q-Learning
  • 深度 Q 學習 ( Q-Learning )
  • 政策梯度
  • Actor Critic
  • 深度確定政策梯度(DDPG)
  • 雙延遲 DDPG (TD3)
  • 強化學習的基礎技術
  • 如何實現過度執行最具挑戰性的虛擬應用程式的先進人工智慧模型

要求

  • 一些數學基礎,比如知道什麼是微分( differentiation ) 或梯度( gradient )
  • 一點程式設計知識( classes 和 objects )

課程說明

歡迎來到深度強化學習2.0!

在本課程中,我們將學習並實現一種新的令人難以置信的聰明的人工智慧模型,稱為雙延遲 DDPG( Twin-Delayed DDPG ),它結合了人工智慧領域的最新技術,包括連續雙深度 Q 學習( Double Deep Q-Learning )、政策梯度( Policy Gradient )和 Actor Critic。 這個模型是如此強大,以至於在我們的課程中,我們第一次能夠解決最具挑戰性的虛擬人工智慧應用程式(訓練一隻螞蟻 / 蜘蛛和一個半人形機器人在田野中行走和奔跑)。

為了正確理解這種模式,我們將課程分為三個部分:

第一部分: 基礎

在這一部分,我們將學習人工智慧的所有基礎知識,這將使你理解和掌握這門課程中的人工智慧。 這些包括 Q-學習,深度 Q-學習,政策梯度,Actor Critic 和更多。

第二部分: 雙延遲的 DDPG ( Twin-Delayed DDPG )理論

我們將深入研究模型背後的整個理論。 通過一系列清晰的視覺化幻燈片,您將清楚地看到人工智慧的整個構建和培訓過程。 你不僅可以詳細地學習這個理論,而且你還可以對人工智慧的學習和工作形成一種強烈的直覺。 第1部分的基礎知識,結合第二部分非常詳細的理論,將使你能夠訪問這個高度進階的模型,並且你最終將成為少數幾個能夠掌握這個模型的人之一。

第三部分: 雙延遲的 DDPG 實現

我們將從頭開始實現這個模型,一步一步地,通過互動式會話,這是本課程的一個新特性,在我們實現這個模型的同時,你可以練習許多程式設計練習。 通過這樣做,你將不會被動地遵循課程,而是非常積極地,因此允許你有效地提高你的技能。 最後但並非最不重要的,我們將在 Colaboratory 或者 Google Colab 上完成整個實現,這是一個完全免費和開源的 AI 平台,允許你編碼和訓練一些 AI,而不需要在你的機器上安裝任何套件。 換句話說,你可以100% 確信你按下執行按鈕,人工智慧將開始訓練,最後你將獲得蜘蛛和人形機器人跑步的視訊。

目標受眾

  • 想把自己的人工智慧技能提升到一個新的水平的資料科學家
  • 希望拓展應用領域的人工智慧專家
  • 從事技術和自動化工作的工程師
  • 希望在競爭中領先的商務人士和公司
  • 希望從事資料科學、機器學習或人工智慧職業的技術相關專業的學生
  • 任何對人工智慧充滿熱情的人

講師簡介

Hadelin de Ponteves   資料科學家

你好。我的名字是 Hadelin de Ponteves。總是渴望學習,我投入了大量的時間在學習和教學中,涵蓋廣泛的科學話題。

今天我熱衷於機器學習、深入學習和人工智慧 ( AI )。我將盡最大的努力傳達我對資料科學的熱情。我在這個領域獲得了豐富的經驗。我擁有資料科學專業的工程碩士學位。我花了一年時間研究機器學習,從事創新和令人興奮的專案。 然後在Google的工作經驗中,我實施了一些用於商業分析的機器學習模型。

最終,我意識到我花了大部分時間做分析,我逐漸需要培養更多的創意,所以我踏入創業生涯。我的課程結合分析和創造力的兩個維度,使你可以在應用於創意思考的同時學習資料科學中所需的所有分析技能。

期待和你一起完成學習!

Hadelin de Ponteves

Kirill Eremenko   資料科學家和外匯系統專家

我的名字是 Kirill Eremenko ,你正在讀這讓我超級興奮 !

我在 Udemy 兩個類別的領域授課 : 資料科學和外匯交易。我想你將會對我是否可以提供你最好的訓練有信心,以下是我在這兩個領域的一些背景。

資料科學

在專業方面,我有超過 5 年在金融、零售、交通運輸等行業的資料科學管理顧問經驗。曾受過澳大利亞 Deloitte 最好的分析導師的訓練,今天我運用大數據來推動企業戰略、改造客戶體驗和徹底改變現有的操作流程。

從我的課程中,你將立即注意到我如何將現實生活的經驗和物理與數學學術背景結合起來,在資料科學領域提供專業的分步指導。我也熱衷於公開演講,並定期在澳大利亞領先的大學和行業盛會上介紹大數據。

外匯交易

自2007年以來,我一直以交易員的身份積極參與外匯市場,並辦 MQL4 的程式設計課程計畫。我很享受外匯交易,因為外匯市場可以帶來的財務上的自由,更重要的 – 個人自由

我生活的另一部分-是一個資料科學家 – 研究商業流程和人類行為模式的各種模式… 聽起來很熟悉?是的!巧合的是,我也是演算法交易的大粉絲 : ) EAs、外匯機器人、指標、腳本、MQL4, 甚至使用 java 程式設計做外匯 – 我全部都很愛!

Kirill Eremenko

Dr. Ryan Ahmed, Ph.D., MBA  教授和暢銷的 Udemy 講師 更多講師主講課程介紹 )

Ryan Ahmed 是一位熱愛教育和科技的暢銷的 Udemy 教練。Ryan 的使命是讓每個人都能獲得優質的教育,並且負擔得起。Ryan 擁有博士學位。麥克馬斯特大學( McMaster* University )工程學士學位,主修機電一體化和電動汽車(EV)控制。他還獲得了麥克馬斯特應用科學碩士學位,專注於人工智慧(AI)和 DeGroote 商學院的金融 MBA。

Ryan 在全球頂級科技公司擔任過多個工程職位,例如三星美國公司和菲亞特克萊斯勒汽車公司 (FCA) 加拿大公司。 他為來自 160 個國家的超過 325,000 名學生教授了超過 46 門科學、技術、工程和數學課程,獲得了 29,000 多條 5 星評價,總體評分為 4.5/5。 Ryan 還領導著一個名為 “Prof. Ryan Ahmed” 的 YouTube 頻道,約 100 萬瀏覽量和 27,000 多名訂閱者,向人們傳授人工智慧、機器學習和資料科學知識。

Ryan 發表了超過 33 篇關於人工智慧、機器學習、狀態估計、電池建模和電動汽車控制的期刊和會議研究論文。 他是美國密歇根州底特律舉行的 IEEE 交通電氣化會議暨博覽會 (iTEC 2012) 最佳論文獎的共同獲得者。 Ryan 是史丹佛認證專案經理 (SCPM)、安大略省認證專業工程師 (P.Eng.)、汽車工程師協會 (SAE) 會員以及電氣和電子工程師協會 (IEEE) 會員。 他還是美國伊利諾伊州芝加哥 2017 年 IEEE 交通和電氣化會議 (iTEC’17) 的計畫聯合主席。

*麥克馬斯特大學是僅有的加拿大大學中四所持續排名全球前100名的大學之一。

SuperDataScience 團隊    幫助資料科學家成功的團隊

Hi, 你好!

我們是 SuperDataScience 團隊。你將在 Kirill Eremenko 教授的資料科學課程中看到我們 – 我們在這裡幫助你解決任何問題,並確保你在課程的旅程中總是一舤風順!

聯繫最好的方法是在你正在學習的課程的問答中討論。在大多數情況下,我們會在24小時內回覆。

我們熱衷於幫助你享受課程!

課堂中見囉!

誠摯地,
SuperDataScience 真正的人

英文字幕:有

  • 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To

  • 點選這個 Network & Security 課程✨優惠連結✨ ( NT370 起限時特價中 ) | Udemy 永久擁有課程 ( 在電腦瀏覽器登入,點選“優惠連結”後再回想要的課程介紹中點選“報名參加課程”即可取得 )
  • Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
  • 手機上點選優惠連結看到的價格比電腦上看到的貴
  • $代表當地貨幣, 如在台灣為 NT
  • 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現

報名參加課程

Sponsored by Udemy


也許你會有興趣

不受 FB 演算法影響,歡迎透過 e-mail 訂閱網站更新

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

Powered by WordPress.com.

Up ↑

%d