Contents
書籍簡介
這是對 Dask 作為 PySpark 替代品的非常好的介紹。
– Jeremy Loscheider
作者做了一個非凡的工作,突顯了為什麼 DASK 應該成為在這個領域工作的任何人的首選工具。
– Gregory Matuszek
對於任何開始進入資料科學的人來說,這是一本非常好的書。
– Julien Pohie
如果你正在使用 Pandas、NumPy 或 Scikit 進行資料分析,你就會瞭解” THE WALL “。在某些時候,你需要為系統引入並行性( parallelism )來處理更大規模的資料或分析任務。 就碰到 ” THE WALL “的問題,這時你可能必須重寫程式碼、重新設計系統,或者使用 Spark 或 Flink 等不熟悉的技術重新開始。
Dask 是一種原生並行分析工具,旨在與你已經使用的程式庫無縫整合,包括Pandas、NumPy 和 Scikit-Learn。使用 Dask,你可以使用已經用過的工具來處理大型資料集。”使用 Python 和 Dask 進行規模化的資料科學“是你在不改變工作方式的情況下使用 Dask 進行資料專案的指南!
關於這個技術
Dask 是個自給自足的、易於擴充的程式庫,用於查詢、串流、過濾和合併大型資料集。 Dask 簡化了資料並行性,因此你可以用更少的時間在低階系統管理,並將更多時間用於探索資料。 Dask 具有內建的排程程式 – 子系統,可以分配計算任務 – 使用執行緒或處理程序在單個機器上建立並行性。更高階的排程允許你完全利用叢集( clusters ) 或 HPC 系統。
大型資料集往往是分散式的、不均勻的,並且容易發生變化。 Dask 簡化了攝取、過濾和轉換資料的處理程序,減少或消除了像 Spark 這樣的重量級框架的需求。你甚至可以在 Python 中開始和完成大規模資料專案。
關於這本書
“使用 Python 和 Dask 進行規模化的資料科學”教你如何建構可處理大量資料的分散式資料專案。你將先瞭解 Dask 框架,聚焦 Dask 如何原生地擴充常用的 Python 程式庫,如 Numpy 和 Pandas。特別關注資料分析,你將立即開始探索NYC 2013-2017 停車票資料庫中的大量資料。你將瞭解 Dask DataFrames 並學習有用的程式碼模式以簡化分析。你還將深入瞭解 Seaborn 的視覺化,並學習使用 Dask-ML 建構機器學習模型。
在學習 Dask 的功能時,你將學習如何準備和分析資料集,以發現紐約市停車執法行動的趨勢和模式。一年中的時間和天氣如何影響開單?開單次數是上升還是下降?你將從資料發現並明暸類似的趨勢!在此過程中,你將深入瞭解 Dask Arrays 和Bags,使用 Datashader 建構基於位置的互動式視覺化,並學習使用自訂任務圖實現你自己的演演算法。最後,你將學習如何擴充 Dask 應用程式並學習如何使用 AWS 和 Docker 建構自己的 Dask 叢集。
書籍內容包含
- 使用大型結構化資料集
- 編寫自己的 DataFrame
- 清理並視覺化你的 DataFrame
- 使用 Dask-ML 進行機器學習
- 使用 Bags 和 Arrays
- 使用 Dask Distributed 建構分散式應用程式
- 打包和佈署 Dask 應用程式
目標讀者
為具有使用 Python 經驗的資料工程師和科學家編寫。瞭解PyData 堆棧(Pandas、NumPy、SciPy、Scikit-Learn)將會很有幫助。不需要具有低階並行性的經驗。
關於作者
Jesse Daniel 有五年使用 Python 編寫應用程式的經驗,包括在 PyData 堆棧中工作三年(Pandas、NumPy、SciPy、Scikit-Learn)。 Jesse 於 2016 年加入丹佛( Denver )大學,擔任商業資訊和分析的兼職教授,目前他在那裡教授 Python 資料科學課程。
關於 MEAP 搶鮮電子書
一本書可能需要一年或更長的時間才能寫出來,那麼你今天如何學習熱門新技術? 答案是MEAP,即 Manning Early Access 計劃。 在 MEAP 中,你可以逐次閱讀章節方式閱讀一本書當書還在進行撰寫中,一旦完成,即可獲得最終的電子書。 如果你預訂實體書籍,你必須在上架到商店之前等很久。更詳細的 MEAP 請參考 https://www.manning.com/meap-program
書籍討論專區
- 對於這本書有任何問題,或是想要呼朋引伴一起學習,分享學習心得,歡迎到書籍討論專區留言
書籍網址 | 每日優惠代碼查詢

你可能會有興趣
- 與 Python 相關的資料科學線上課程
- Python 學習地圖
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 追蹤這個 Twitter ,得到 Soft & Share 特價課程訊息
你必須登入才能發表留言。