MEAP 搶鮮電子書 – Deep Reinforcement Learning in Action

我對深度強化學習感到好奇一段時間了，但卻找不到任何沒有數學超載或過於簡單化的資料。你的書剛剛好，正是我想要的！

～Maxim Pankratov

書籍簡介

人類從反饋中學得最好 – 我們在被激勵採取導致正向結果的行動，同時對負面結果則決定阻擋。這種強化過程可以應用於電腦程式，使它們能夠解決經典程式設計無法解決的更複雜的問題。 Deep Reinforcement Learning in Action 介紹深度強化學習的基本概念和術語，以及將其實施到你自己的專案中所需的實用技能和技術。

關於這個技術

深度強化學習是機器學習的一種形式，其中 AI 代理從他們自己的原始感官輸入中學習最佳行為。系統感知環境，解釋其過去決策的結果，並使用此資訊來優化其行為，以獲得最大的長期回報。深度強化學習為 AlphaGo 成功做出巨大的貢獻，但這還不是它能做到的全部！更令人興奮的應用正等著被發現。讓我們開始吧。

關於這本書

Deep Reinforcement Learning in Action 教你如何根據環境的直接反饋對學習和改進的代理進行程式設計。你將使用流行的 PyTorch 深度學習框架建構網路，以探索從深度 Q 網路到策略梯度方法到進化演算法的強化學習演算法。當你一路學習時，你會將你所知道的東西應用到實際專案中，比如控制模擬機器人、自動化股票市場交易，甚至建立一個下圍棋的機器人。

書籍內容包含

將問題建構為馬爾可夫決策過程( Markov Decision Processes )
流行的演算法，如深度 Q 網路( Deep Q-Networks )、策略梯度( Policy Gradient )方法等
進化演算法( Evolutionary Algorithms )和驅動它們的直覺
將強化學習演算法應用於現實問題
所有程式碼範例都可以在你自己的電腦上執行無需特殊授權或硬體

目標讀者

你將需要中級 Python 技能和對深度學習的基本理解。

關於作者

Alexander Zai 是亞馬遜 AI 的機器學習工程師，致力於 MXNet ，為一系列 AWS 機器學習產品提供支援。他還是 Codesmith 的聯合創始人，Codesmith 是一家軟體工程訓練營，在洛杉磯和紐約設有駐地。 Brandon Brown 是加州大學洛杉磯分校的 UCSF 醫學院學生和資料科學家。過去三年，他在 outlace.com 上發表了大量關於機器學習的部落格。

關於 MEAP 搶鮮電子書

一本書可能需要一年或更長的時間才能寫出來，那麼你今天如何學習熱門新技術？答案是MEAP，即 Manning Early Access 計劃。在 MEAP 中，你可以逐次閱讀章節方式閱讀一本書當書還在進行撰寫中，一旦完成，即可獲得最終的電子書。 如果你預訂實體書籍，你必須在上架到商店之前等很久。

更詳細的 MEAP 請參考 https://www.manning.com/meap-program