Contents
完整的人工智慧指南,準備深度強化學習,使用股票交易應用程式來學習
從這 14.5 小時的課程,你會學到
- 應用基於梯度的監督式機器學習方法做強化學習 ( reinforcement learning )
- 在技術層面上學習強化學習
- 了解強化學習與心理學之間的關係
- 實現 17 種不同的強化學習演算法
要求
- 微積分
- 機率
- 馬可夫模型
- The Numpy Stack ( 譯註 : Python 的 Numpy 套件 )
- 至少有幾個監督式機器學習 ( supervised machine learning )方法的經驗
- 梯度下降 ( Gradient descent )
- 良好的物件導向程式設計技巧
說明
當人們談論人工智慧時,他們通常並不意味著監督式和非監督式機器學習。
這些任務與我們認為的人工智慧可以做的事相比,是非常微不足道的 – 下西洋棋和圍棋,駕駛汽車以及以超人等級玩視訊遊戲。
強化學習最近已經變得流行起來因為做了上述這些事。
很像深度學習,很多理論在 70 年代和 80 年代被發現,但直到最近,我們已經能夠親眼看到可行的驚人效果。
在2016年,我們看到 Google 的 AlphaGo 在圍棋比賽中擊敗了世界冠軍。
我們看到人工智慧玩視訊遊戲,如 毀滅戰士和超級馬力歐。
自動駕駛汽車已經與真人駕駛車開始在真正的道路上駕駛,甚至搭載乘客(Uber),沒有人力的協助。
如果這聽起來很神奇,那麼為了將來,你可以激勵自己,因為加速回報的法則決定了這一進步只會繼續呈指數級成長。
學習監督式和非監督式機器學習是不小的壯舉。到目前為止,我已經完成了只有這些主題的 16 個課程。
而強化學習則開闢了一個全新的世界。正如你將在本課程中學習的那樣,強化學習的典範與監督式和非監督式學習有所不同。
它在行為心理學和神經科學領域引發了新的和驚人的洞見。正如你將在本課程中學到的,當涉及到教導一位代理人和教導一隻動物甚至人類時,有許多類似的過程。這是我們到目前為止最接近一個真實整體人工智慧所能做到的事。
本課程涵蓋什麼?
- 多武裝強盜問題( multi-armed bandit problem )和探險開發兩難
- 計算移動平均值及其與隨機梯度下降關係的方法
- 馬爾可夫決策流程(MDPs)
- 動態程式設計
- 蒙地卡羅方法
- 暫時的差異(TD)學習
- 近似方法(即如何將深層神經網路或其他可微分模型插入到 RL 演算法中)
如果你準備好參加全新的挑戰,並且學習你在傳統監督式機器學習,非監督式機器學習,甚至深入學習中從未見過的人工智慧技術,那麼本課程將是為你而設計的。
在課堂上見!
注意:
本課程的所有程式碼都可以從我的 github下載:
/lazyprogrammer/machine_learning_examples
在目錄:rl
確保你總是使用 “git pull”,所以你會有最新的版本!
你必須事先了解的知識:
- 微積分
- 機率
- 物件導向程式設計
- Python 程式設計 : if/else, loops, lists, dicts, sets
- Numpy 程式設計 : matrix and vector operations
- 線性迴歸
- 梯度下降
- 技巧 (為了要走完整堂課程)
- 使用兩倍速觀看
- 使用手寫筆記。這將大大增加你保留資訊的能力。
- 寫下方程式。如果不這樣做,我保證只會看起來像亂七八糟的。
- 在討論板上提出很多問題。越多越好!
- 意識到大多數練習將花費數天或數週才能完成。
- 自己編寫程式碼,不要只是坐在那裡看我的程式碼。
修課順序
- 查看講座 “ What order should I take your courses in?” (可在我的任何課程的附錄中找到,或請參考先修課)
目標受眾是?
- 任何想要學習人工智慧,資料科學,機器學習和深入學習的人
- 學生和專業人士
講師簡介
Lazy Programmer Inc 資料科學家和大數據工程師
我是一名資料科學家、大數據工程師和全端軟體工程師。
我有電腦工程的碩士,專長為機器學習和模式辨識。
我曾在網路廣告和數位媒體企業擔任過資料科學家和大數據工程師,圍繞所謂的資料建構各種高流量的 web 服務。我曾經使用 Hadoop / Pig / MapReduce 創建新的大數據管道,也曾建立機器學習模型來預測點擊率,使用線性迴歸、Bayesian Bandits 和協同過濾 ( collaborative filtering )建立新聞推薦系統,並使用A / B測試驗證結果。
我曾在大學部與研究所教授資料科學、統計學、機器學習、演算法、微積分、電腦圖學和物理學,任職的學校如哥倫比亞大學、紐約大學、Hunter 學院和 The New School。
有多家企業已從我的 Web 程式設計專業知識中受益。我做所有的後端(伺服器)、前端(HTML / JS / CSS)和運營/佈署工作。 我使用的技術包含:Python、Ruby / Rails、PHP、Bootstrap、jQuery(Javascript)、Backbone 和 Angular。至於儲存/資料庫,我採用 MySQL、Postgres、Redis、MongoDB等。
英文字幕:有
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
- 點選這個✨優惠連結✨ 課程特價 | Udemy 永久擁有課程 NT390 起( 在電腦瀏覽器登入,點選“優惠連結”後再回想要的課程介紹中點選“報名參加課程”即可取得 )
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程
你可能會有興趣
- 進階 AI : 以 Python 做深度強化( Deep Reinforcement Learning ) 學習
- 尖端的人工智慧: 使用 Python 實現深度強化學習( Deep Reinforcement Learning )
- Python 程式設計學習地圖
- 更多資料科學與機器學習線上課程
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入