Contents
了解如何在 Python 中使用 Spark,包括 Spark Streaming、機器學習、Spark 2.0 DataFrame 等等!
從這 10.5 小時的課程,你會學到
- 一起用 Python 和 Spark 來分析大數據
- 學習如何使用新的 Spark 2.0 DataFrame 語法
- 實踐模擬真實世界情況的諮詢專案!
- 以邏輯迴歸來歸類客戶流失
- 以隨機森林 ( Random Forests ) 使用 Spark 進行分類
- 學習如何使用 Spark 的梯度提升決策樹 ( Gradient Boosted Trees )
- 使用 Spark 的 MLlib 創建強大的機器學習模型
- 了解 DataBricks 平台!
- 在 Amazon Web Services EC2 上設置大數據分析
- 了解如何使用 AWS Elastic MapReduce服務!
- 了解如何利用 Spark 環境中的 Linux 功能!
- 使用 Spark 和自然語言處理創建垃圾郵件過濾器!
- 使用 Spark Streaming 實時分析推文 ( Tweets )!
要求
- 已會任何程式語言(Python 優先)
- 本機有 20 GB 可用空間(或者有 AWS 的強大網路連接)
課程說明
學習最新的大數據技術 – Spark! 並學習使用最流行的程式語言之一 Python 來實踐 Spark!
分析大量數據集的能力是當今最有價值的技術技能之一,本課程特別設計來幫助你快速掌握完成此任務的這最佳技術之一 Apache Spark ! Googleı、Facebook、Netflix、Airbnb、Amazon、NASA 等頂尖技術公司/組織都在使用 Spark 來解決他們的大數據問題!
Spark 可以比 Hadoop MapReduce 執行速度高上100倍,這引發了該技能的需求激增! 由於 Spark 2.0 DataFrame 框架非常新穎,你現在可以快速成為就業市場上最有知識的人之一!
本課程將通過 Python 速成建立基礎,接著帶你學習如何使用 Spark DataFrames 和最新的 Spark 2.0 語法! 一旦我們完成了這些工作,我們將學習如何使用帶有 DataFrame 語法和 Spark 的 MLlib Machine Library。 一路下來,你將做過練習和模擬諮詢專案,使你能夠立即進入真實的世界,有能力使用新技能解決實際問題!
我們還介紹了最新的 Spark Technologies,如 Spark SQL、Spark Streaming 以及Gradient Boosted Trees 等高級模型! 完成本課程後,你將有自信把 Spark 和 PySpark 放在你的履歷中! 本課程還有完整的 30 天退款保證,並附帶 LinkedIn 完成證書!
如果你準備好跳入 Python、Spark和大數據 ( Big Data ) 的世界,這是你的課程!
目標受眾
- 已懂 Python 並希望學習如何將其用於大數據
- 已非常熟悉另一種程式語言,需要學習 Spark
講師簡介
Jose Portilla 資料科學家
Jose Marcial Portilla 擁有來自聖克拉拉(Santa Clara )大學的機械工程學士學位和碩士學位,也有多年資料科學和程式設計專業教練和培訓師的經驗。 他在各種領域如微流體 、材料科學和資料科學技術中有出版物和專利。在他的職業生涯中,他已經發展了分析數據的技能,他希望利用他在教學和資料科學方面的經驗,幫助其他人學習程式開發的能力、分析數據,以及清晰地呈現數據和漂亮的可視化。目前他是 Pierian Data Inc. 的數據科學主管,為世界各地的各種公司提供現場資料科學和 python 培訓課程,包括瑞士信貸等頂級銀行。隨時在 LinkedIn 上與他聯繫,獲取有關面對面培訓課程的更多信息。
英文字幕:有
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
- 點選這個✨優惠連結✨ 課程特價 | Udemy 永久擁有課程 NT330 起( 在電腦瀏覽器登入,點選“優惠連結”後再回想要的課程介紹中點選“報名參加課程”即可取得 )
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程
也許你會有興趣
- 更多大數據相關線上課程介紹
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!