fbpx

PySpark : 使用 Spark 和 Python 分析大數據

了解如何在 Python 中使用 Spark,包括 Spark Streaming、機器學習、Spark 2.0 DataFrame 等等!

報名參加課程

從這 10.5 小時的課程,你會學到

  • 一起用 Python 和 Spark 來分析大數據
  • 學習如何使用新的 Spark 2.0 DataFrame 語法
  • 實踐模擬真實世界情況的諮詢專案!
  • 以邏輯迴歸來歸類客戶流失
  • 以隨機森林 ( Random Forests ) 使用 Spark 進行分類
  • 學習如何使用 Spark 的梯度提升決策樹 ( Gradient Boosted Trees )
  • 使用 Spark 的 MLlib 創建強大的機器學習模型
  • 了解 DataBricks 平台!
  • 在 Amazon Web Services EC2 上設置大數據分析
  • 了解如何使用 AWS Elastic MapReduce服務!
  • 了解如何利用 Spark 環境中的 Linux 功能!
  • 使用 Spark 和自然語言處理創建垃圾郵件過濾器!
  • 使用 Spark Streaming 實時分析推文 ( Tweets )!

要求

  • 已會任何程式語言(Python 優先)
  • 本機有 20 GB 可用空間(或者有 AWS 的強大網路連接)

課程說明

學習最新的大數據技術 – Spark! 並學習使用最流行的程式語言之一 Python 來實踐 Spark!

分析大量數據集的能力是當今最有價值的技術技能之一,本課程特別設計來幫助你快速掌握完成此任務的這最佳技術之一 Apache Spark ! Googleı、Facebook、Netflix、Airbnb、Amazon、NASA 等頂尖技術公司/組織都在使用 Spark 來解決他們的大數據問題

Spark 可以比 Hadoop MapReduce 執行速度高上100倍,這引發了該技能的需求激增! 由於 Spark 2.0 DataFrame 框架非常新穎,你現在可以快速成為就業市場上最有知識的人之一!

本課程將通過 Python 速成建立基礎,接著帶你學習如何使用 Spark DataFrames 和最新的 Spark 2.0 語法! 一旦我們完成了這些工作,我們將學習如何使用帶有 DataFrame 語法和 Spark 的 MLlib Machine Library。 一路下來,你將做過練習和模擬諮詢專案,使你能夠立即進入真實的世界,有能力使用新技能解決實際問題!

我們還介紹了最新的 Spark Technologies,如 Spark SQL、Spark Streaming 以及Gradient Boosted Trees 等高級模型! 完成本課程後,你將有自信把 Spark 和 PySpark 放在你的履歷中! 本課程還有完整的 30 天退款保證,並附帶 LinkedIn 完成證書!

如果你準備好跳入 Python、Spark和大數據 ( Big Data ) 的世界,這是你的課程!

目標受眾

  • 已懂 Python 並希望學習如何將其用於大數據
  • 已非常熟悉另一種程式語言,需要學習 Spark

講師簡介

Jose Portilla  資料科學家

Jose Marcial Portilla 擁有來自聖克拉拉(Santa Clara )大學的機械工程學士學位和碩士學位,也有多年資料科學和程式設計專業教練和培訓師的經驗。 他在各種領域如微流體 、材料科學和資料科學技術中有出版物和專利。在他的職業生涯中,他已經發展了分析數據的技能,他希望利用他在教學和資料科學方面的經驗,幫助其他人學習程式開發的能力、分析數據,以及清晰地呈現數據和漂亮的可視化。目前他是 Pierian Data Inc. 的數據科學主管,為世界各地的各種公司提供現場資料科學和 python 培訓課程,包括瑞士信貸等頂級銀行。隨時在 LinkedIn 上與他聯繫,獲取有關面對面培訓課程的更多信息。

英文字幕:有  

  • 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To

報名參加課程

Sponsored by Udemy

也許你會有興趣

 歡迎使用 App / Email | Telegram 訂閱 網站更新

Spread the love

這個網站採用 Akismet 服務減少垃圾留言。進一步瞭解 Akismet 如何處理網站訪客的留言資料

Powered by WordPress.com.

Up ↑

%d 位部落客按了讚: