fbpx

Manning 搶鮮線上課程 – Spark in Motion

課程簡介

快速,別胡說八道。 你還想要什麼? ~ Jonathan Rioux, Senior Analyst

目前為止我所看到的最好的課程。 ~ Peter J. Hampton, AI Researcher

Spark 是一個非常有價值的程式庫,但它很難使用(學習步驟非常陡峭)。 這個視訊課程使學習變得更順暢,並將使用者帶到一個可以自己進行實驗的地方。 ~Alberto Boschetti, Data Scientist

觀看。 動手做。 學習! Spark in Motion 通過高品質的視訊課程和內建的練習來教你如何使用 Spark 進行大數據分析,所以你可以將你所學到的付諸實踐。

Continue reading “Manning 搶鮮線上課程 – Spark in Motion”

[電子書] Spark in Action

書籍簡介

深入並實際操作,今天就開始運用其中一種最熱門的資料處理引擎。 一本很棒的指南!

Jonathan Sharley, Pandora Media

Spark in Action 教你使用 Spark 有效率地處理批次和串流資料所需要的理論和技能。 完全為Spark 2.0更新。

關於這個技術

大型資料系統將資料集分散在不同機器叢集中,這讓有效地查詢,資料串流和解釋這些資料是一大挑戰。 Spark 可以幫助。 它是專為分散式資料設計的處理系統。 它提供易於使用的界面,以及你需要的可上線品質分析效能和機器學習所需的性能。 Spark 2 還增加了改進的程式設計 API,更好的性能和無數的其它升級功能。

關於這本書

Spark in Action 教你使用 Spark 有效處理批次和串流資料所需的理論和技能。 通過幾個介紹性的範例, 你可以很方便的使用 Spark CLI。 然後,你將使用其核心 API 開始編程 Spark。 一路上,你將使用 Spark SQL 處理結構化資料,運用 Spark GraphX 處理近乎即時的串流式傳輸資料,應用機器學習演算法和非事先定義的圖形資料。 為了輕鬆開始,你可以下載預先配置好的虛擬機器,以方便你嘗試本書的程式碼。

書籍內容包含

  • 為 Spark 2.0 更新
  • 真實案例研究
  • 使用 Docker 做 Spark DevOps
  • 使用 Scala 的範例,以及使用 Java 和 Python 上線

目標讀者

為具有大數據或機器學習背景的有經驗程式設計師撰寫。

關於作者

PetarZečević 和 MarkoBonaći 是大量參與 Spark 社群且經驗豐富的開發人員。


書籍網址

Manning___Spark_in_Action

你可能會有興趣

喜歡我們的分享嗎? 使用以下的社群分享按鈕也分享給你的朋友吧!

使用 Java 整合 Apache Spark 課程

通過10多個動手做實例,了解如何使用 Apache Spark 分析大型資料集。 把你的大數據技能提升到一個新的水平。

課程長度 3.5 個小時,你會學到

  • Apache Spark 架構概述。
  • 使用 Apache Spark 的主要抽象層,彈性分散式資料集(RDD) 來處理和分析大型資料集。
  • 使用 RDD transformations 和 actions 以及 Spark SQL 開發 Apache Spark 2.0 應用程 式。
  • 透過 Amazon 的 Elastic MapReduce 服務在 Hadoop YARN 叢集上擴展 Spark 應用程式。
  • 使用 Datasets 和 DataFrames 分析結構化和半結構化資料,並對 Spark SQL 的全面了解。
  • 透過廣播變數和累加器在 Apache Spark 叢集上的不同節點之間共享資訊。
  • 透過 partitioning,caching 和 persisting RDD來優化和調整 Apache Spark 作業的進階技術。
  • 使用 Apache Spark 在該領域的最佳實踐。

課程網址 ♥找優惠折扣碼?

spark

Sponsored by Udemy

也許你會有興趣

喜歡我們的分享嗎?使用以下的社群分享按鈕分享給你的朋友吧!

運用 Scala 和 Apache Spark 2.0 親手做大數據分析

本課程的講師曾於 Amazon 和 IMDb 9 年,開發和管理過自動向億萬客戶提供產品和電影推薦的技術,且擁有分散式計算 、資料探勘和機器學習等領域擁有 17 項專利。 本課程將帶你深入 20多個案例(如電影評等來查找彼此相似的電影),由簡到繁,在自己的系統或使用 Amazon 的 Elastic MapReduce 雲端服務,運用 Scala、Apache Spark、Hadoop 親手分析大數據!

Continue reading “運用 Scala 和 Apache Spark 2.0 親手做大數據分析”

使用 Apache Spark 和 Python 來處理大數據 – 實際動手做!

講師 Frank 在 Amazon 和 IMDb ( 電影影評網站 ) 共有 9 年工作經驗,而且在分散式計算,資料探勘和機器學習領域擁有17項專利,這堂課他會帶你動手做大數據分析,而且當然是使用 IMDb 的資料並且在 Amazon 的雲端上執行,共有 15 個實踐範例,上這堂課最好已經有 Python 基礎,如果你不要使用 Python,講師也有錄製另一個課程是使用 Scala 的版本

Continue reading “使用 Apache Spark 和 Python 來處理大數據 – 實際動手做!”

Powered by WordPress.com.

Up ↑