Contents
通過10多個動手做實例,了解如何使用 Apache Spark 分析大型資料集。 把你的大數據技能提升到一個新的水平。
課程長度 3.5 個小時,你會學到
- Apache Spark 架構概述。
- 使用 Apache Spark 的主要抽象層,彈性分散式資料集(RDD) 來處理和分析大型資料集。
- 使用 RDD transformations 和 actions 以及 Spark SQL 開發 Apache Spark 2.0 應用程 式。
- 透過 Amazon 的 Elastic MapReduce 服務在 Hadoop YARN 叢集上擴展 Spark 應用程式。
- 使用 Datasets 和 DataFrames 分析結構化和半結構化資料,並對 Spark SQL 的全面了解。
- 透過廣播變數和累加器在 Apache Spark 叢集上的不同節點之間共享資訊。
- 透過 partitioning,caching 和 persisting RDD來優化和調整 Apache Spark 作業的進階技術。
- 使用 Apache Spark 在該領域的最佳實踐。
課程網址 ♥找優惠折扣碼?
也許你會有興趣
- 更多 Apache Spark 線上課程介紹
- 更多 Java 線上課程介紹
- 更多資料科學與機器學習相關課程
- 使用 e-mail 訂閱 Soft & Share 內容發布 – 透過 e-mail 提早收到 Soft & Share 發布的好康訊息!
- Soft & Share 特價課程與學習資訊分享 加入這個社團追蹤特價課程與學習資訊
- 追蹤這個 Twitter ,得到 Udemy 特價課程訊息
你必須登入才能發表留言。