Contents
我對深度強化學習感到好奇一段時間了,但卻找不到任何沒有數學超載或過於簡單化的資料。你的書剛剛好,正是我想要的!
~Maxim Pankratov
書籍簡介
人類從反饋中學得最好 – 我們在被激勵採取導致正向結果的行動,同時對負面結果則決定阻擋。這種強化過程可以應用於電腦程式,使它們能夠解決經典程式設計無法解決的更複雜的問題。 Deep Reinforcement Learning in Action 介紹深度強化學習的基本概念和術語,以及將其實施到你自己的專案中所需的實用技能和技術。
關於這個技術
深度強化學習是機器學習的一種形式,其中 AI 代理從他們自己的原始感官輸入中學習最佳行為。系統感知環境,解釋其過去決策的結果,並使用此資訊來優化其行為,以獲得最大的長期回報。深度強化學習為 AlphaGo 成功做出巨大的貢獻,但這還不是它能做到的全部!更令人興奮的應用正等著被發現。讓我們開始吧。
關於這本書
Deep Reinforcement Learning in Action 教你如何根據環境的直接反饋對學習和改進的代理進行程式設計。你將使用流行的 PyTorch 深度學習框架建構網路,以探索從深度 Q 網路到策略梯度方法到進化演算法的強化學習演算法。 當你一路學習時,你會將你所知道的東西應用到實際專案中,比如控制模擬機器人、自動化股票市場交易,甚至建立一個下 圍棋的機器人。
書籍內容包含
- 將問題建構為馬爾可夫決策過程( Markov Decision Processes )
- 流行的演算法,如深度 Q 網路( Deep Q-Networks )、策略梯度( Policy Gradient )方法等
- 進化演算法( Evolutionary Algorithms )和驅動它們的直覺
- 將強化學習演算法應用於現實問題
- 所有程式碼範例都可以在你自己的電腦上執行無需特殊授權或硬體
目標讀者
關於作者
Alexander Zai 是亞馬遜 AI 的機器學習工程師,致力於 MXNet ,為一系列 AWS 機器學習產品提供支援。他還是 Codesmith 的聯合創始人,Codesmith 是一家軟體工程訓練營,在洛杉磯和紐約設有駐地。 Brandon Brown 是加州大學洛杉磯分校的 UCSF 醫學院學生和資料科學家。過去三年,他在
關於 MEAP 搶鮮電子書
一本書可能需要一年或更長的時間才能寫出來,那麼你今天如何學習熱門新技術? 答案是MEAP,即 Manning Early Access 計劃。 在 MEAP 中,你可以逐次閱讀章節方式閱讀一本書當書還在進行撰寫中,一旦完成,即可獲得最終的電子書。 如果你預訂實體書籍,你必須在上架到商店之前等很久。
更詳細的 MEAP 請參考 https://www.manning.com/meap-program
購買電子書


你可能會有興趣
- 深度學習相關線上課程與電子書
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入
發表迴響