Contents
書籍簡介
深入並實際操作,今天就開始運用其中一種最熱門的資料處理引擎。 一本很棒的指南!
Jonathan Sharley, Pandora Media
Spark in Action 教你使用 Spark 有效率地處理批次和串流資料所需要的理論和技能。 完全為Spark 2.0更新。
關於這個技術
大型資料系統將資料集分散在不同機器叢集中,這讓有效地查詢,資料串流和解釋這些資料是一大挑戰。 Spark 可以幫助。 它是專為分散式資料設計的處理系統。 它提供易於使用的界面,以及你需要的可上線品質分析效能和機器學習所需的性能。 Spark 2 還增加了改進的程式設計 API,更好的性能和無數的其它升級功能。
關於這本書
Spark in Action 教你使用 Spark 有效處理批次和串流資料所需的理論和技能。 通過幾個介紹性的範例, 你可以很方便的使用 Spark CLI。 然後,你將使用其核心 API 開始編程 Spark。 一路上,你將使用 Spark SQL 處理結構化資料,運用 Spark GraphX 處理近乎即時的串流式傳輸資料,應用機器學習演算法和非事先定義的圖形資料。 為了輕鬆開始,你可以下載預先配置好的虛擬機器,以方便你嘗試本書的程式碼。
書籍內容包含
- 為 Spark 2.0 更新
- 真實案例研究
- 使用 Docker 做 Spark DevOps
- 使用 Scala 的範例,以及使用 Java 和 Python 上線
目標讀者
為具有大數據或機器學習背景的有經驗程式設計師撰寫。
關於作者
PetarZečević 和 MarkoBonaći 是大量參與 Spark 社群且經驗豐富的開發人員。
書籍網址
你可能會有興趣
- [線上課程]運用 Scala 和 Apache Spark 2.0 親手做大數據分析
- Manning 每日 5 折優惠電子書 Manning 每天都會推出三本 5 折優惠電子書
- 更多資料科學與機器學習電子書介紹
- ★想要加強英文能力嗎?
- Soft & Share 團購和特價線上課程 加入這個社團追蹤我們的團購訊息與 Udemy 特價課程訊
- 追蹤這個 Twitter ,得到 Udemy 特價課程訊息
Reblogged this on ®γσ, Eng (白戸則道).