深度強化學習 2.0

最聰明的深度 Q-Learning,政策梯度( Policy Gradient ), Actor Critic,和 DDPG 組合課程

報名參加課程

從這 9.5 小時的課程,你會學到

  • Q-Learning
  • 深度 Q 學習 ( Q-Learning )
  • 政策梯度
  • Actor Critic
  • 深度確定政策梯度(DDPG)
  • 雙延遲 DDPG (TD3)
  • 強化學習的基礎技術
  • 如何實現過度執行最具挑戰性的虛擬應用程式的先進人工智慧模型

要求

  • 一些數學基礎,比如知道什麼是微分( differentiation ) 或梯度( gradient )
  • 一點程式設計知識(類別和物件)

課程說明

歡迎來到深度強化學習2.0!

在本課程中,我們將學習並實現一種新的令人難以置信的聰明的人工智慧模型,稱為雙延遲 DDPG( Twin-Delayed DDPG ),它結合了人工智慧領域的最新技術,包括連續雙深度 Q 學習( Double Deep Q-Learning )、政策梯度( Policy Gradient )和 Actor Critic。 這個模型是如此強大,以至於在我們的課程中,我們第一次能夠解決最具挑戰性的虛擬人工智慧應用程式(訓練一隻螞蟻 / 蜘蛛和一個半人形機器人在田野中行走和奔跑)。

為了正確理解這種模式,我們將課程分為三個部分:

第一部分: 基礎

在這一部分,我們將學習人工智慧的所有基礎知識,這將使你理解和掌握這門課程中的人工智慧。 這些包括 Q-學習,深度 Q-學習,政策梯度,Actor Critic和更多。

第二部分: 雙延遲的 DDPG ( Twin-Delayed DDPG )理論

我們將深入研究模型背後的整個理論。 通過一系列清晰的視覺化幻燈片,您將清楚地看到人工智慧的整個構建和培訓過程。 你不僅可以詳細地學習這個理論,而且你還可以對人工智慧的學習和工作形成一種強烈的直覺。 第1部分的基礎知識,結合第2部分非常詳細的理論,將使您能夠訪問這個高度進階的模型,並且您最終將成為少數幾個能夠掌握這個模型的人之一。

第三部分: 雙延遲的 DDPG 實現

我們將從頭開始實現這個模型,一步一步地,通過互動式會話,這是本課程的一個新特性,在我們實現這個模型的同時,您可以練習許多程式設計練習。 通過這樣做,你將不會被動地遵循課程,而是非常積極地,因此允許你有效地提高你的技能。 最後但並非最不重要的,我們將在 Colaboratory 或者 Google Colab 上完成整個實現,這是一個完全免費和開源的 AI 平台,允許你編碼和訓練一些 AI,而不需要在你的機器上安裝任何套件。 換句話說,你可以100% 確信你按下執行按鈕,人工智慧將開始訓練,最後你將獲得蜘蛛和人形機器人跑步的視訊。

目標受眾

  • 想把自己的人工智慧技能提升到一個新的水平的資料科學家
  • 希望拓展應用領域的人工智慧專家
  • 從事技術和自動化工作的工程師
  • 希望在競爭中領先的商務人士和公司
  • 希望從事資料科學、機器學習或人工智慧職業的技術相關專業的學生
  • 任何對人工智慧充滿熱情的人

講師簡介

Hadelin de Ponteves   資料科學家

你好。我的名字是 Hadelin de Ponteves。總是渴望學習,我投入了大量的時間在學習和教學中,涵蓋廣泛的科學話題。

今天我熱衷於機器學習、深入學習和人工智慧 ( AI )。我將盡最大的努力傳達我對資料科學的熱情。我在這個領域獲得了豐富的經驗。我擁有資料科學專業的工程碩士學位。我花了一年時間研究機器學習,從事創新和令人興奮的專案。 然後在Google的工作經驗中,我實施了一些用於商業分析的機器學習模型。

最終,我意識到我花了大部分時間做分析,我逐漸需要培養更多的創意,所以我踏入創業生涯。我的課程結合分析和創造力的兩個維度,使你可以在應用於創意思考的同時學習資料科學中所需的所有分析技能。

期待和你一起完成學習!

Hadelin de Ponteves

Kirill Eremenko   資料科學家和外匯系統專家

我的名字是 Kirill Eremenko ,你正在讀這讓我超級興奮 !

我在 Udemy 兩個類別的領域授課 : 資料科學和外匯交易。我想你將會對我是否可以提供你最好的訓練有信心,以下是我在這兩個領域的一些背景。

資料科學

在專業方面,我有超過 5 年在金融、零售、交通運輸等行業的資料科學管理顧問經驗。曾受過澳大利亞 Deloitte 最好的分析導師的訓練,今天我運用大數據來推動企業戰略、改造客戶體驗和徹底改變現有的操作流程。

從我的課程中,你將立即注意到我如何將現實生活的經驗和物理與數學學術背景結合起來,在資料科學領域提供專業的分步指導。我也熱衷於公開演講,並定期在澳大利亞領先的大學和行業盛會上介紹大數據。

外匯交易

自2007年以來,我一直以交易員的身份積極參與外匯市場,並辦 MQL4 的程式設計課程計畫。我很享受外匯交易,因為外匯市場可以帶來的財務上的自由,更重要的 – 個人自由

我生活的另一部分-是一個資料科學家 – 研究商業流程和人類行為模式的各種模式… 聽起來很熟悉?是的!巧合的是,我也是演算法交易的大粉絲 : ) EAs、外匯機器人、指標、腳本、MQL4, 甚至使用 java 程式設計做外匯 – 我全部都很愛!

Kirill Eremenko

Dr. Ryan Ahmed, Ph.D., MBA  教授和暢銷的 Udemy 講師

Ryan Ahmed 是一位熱愛教育和科技的暢銷的 Udemy 教練。Ryan 的使命是讓每個人都能獲得優質的教育,並且負擔得起。Ryan 擁有博士學位。麥克馬斯特大學( McMaster* University )工程學士學位,主修機電一體化和電動汽車(EV)控制。他還獲得了麥克馬斯特應用科學碩士學位,專注於人工智慧(AI)和 DeGroote 商學院的金融 MBA。

Ryan 在全球財富100強公司擔任多個工程職位。最近,他在三星美國擔任系統工程主管,並擔任加拿大菲亞特克萊斯勒汽車公司(FCA)的高級科學研究和實驗開發技術專家。Ryan 已經為全球超過 10,000 多名學生教授了工程、科學、技術和數學方面的幾門課程。他是美國密歇根州底特律 IEEE 交通電氣會議和博覽會(iTEC 2012)最佳論文獎的獲獎者。

Ryan是安大略省斯坦福大學認證專案經理(SCPM)、認證專業工程師(P.Eng。)、汽車工程師協會(SAE)成員、電氣和電子工程師協會(IEEE)會員。他還是美國伊利諾州芝加哥舉辦的2017  IEEE 運輸與電氣化會議(iTEC’17)的項目聯合主席。

*麥克馬斯特大學是僅有的加拿大大學中四所持續排名全球前100名的大學之一。

SuperDataScience 團隊    幫助資料科學家成功的團隊

Hi, 你好!

我們是 SuperDataScience 團隊。你將在 Kirill Eremenko 教授的資料科學課程中看到我們 – 我們在這裡幫助你解決任何問題,並確保你在課程的旅程中總是一舤風順!

聯繫最好的方法是在你正在學習的課程的問答中討論。在大多數情況下,我們會在24小時內回覆。

我們熱衷於幫助你享受課程!

課堂中見囉!

誠摯地,
SuperDataScience 真正的人

英文字幕:有

  • 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
  • 本課程簡中字幕版

報名參加課程

Sponsored by Udemy

也許你會有興趣

 歡迎使用 App / Email | Telegram 訂閱 網站更新

這個網站採用 Akismet 服務減少垃圾留言。進一步瞭解 Akismet 如何處理網站訪客的留言資料

Powered by WordPress.com.

Up ↑

%d 位部落客按了讚: