Contents
通過10多個動手做實例,了解如何使用 Apache Spark 分析大型資料集。 把你的大數據技能提升到一個新的水平。
課程長度 3.5 個小時,你會學到
- Apache Spark 架構概述。
- 使用 Apache Spark 的主要抽象層,彈性分散式資料集(RDD) 來處理和分析大型資料集。
- 使用 RDD transformations 和 actions 以及 Spark SQL 開發 Apache Spark 2.0 應用程 式。
- 透過 Amazon 的 Elastic MapReduce 服務在 Hadoop YARN 叢集上擴展 Spark 應用程式。
- 使用 Datasets 和 DataFrames 分析結構化和半結構化資料,並對 Spark SQL 的全面了解。
- 透過廣播變數和累加器在 Apache Spark 叢集上的不同節點之間共享資訊。
- 透過 partitioning,caching 和 persisting RDD來優化和調整 Apache Spark 作業的進階技術。
- 使用 Apache Spark 在該領域的最佳實踐。
要求
- 運行 Windows、OSX 或 Linux 的電腦
- 以前的 Java 程式技能
- Java 8 經驗是首選,但不是必需的
課程說明
這門課程是關於什麼的:
本課程涵蓋有關使用 Java 的 Apache Spark 的所有基礎知識,並教授您使用 Java 開發 Spark 應用程式所需的一切知識。 在本課程結束時,您將深入了解 Apache Spark 以及一般的大數據分析和操作技能,以幫助您的公司採用 Apache Spark 來構建大數據處理管道和數據分析應用程式。
本課程涵蓋 10 多個實踐大數據示例。 您將學到有關如何將數據分析問題構建為 Spark 問題的寶貴知識。 我們將一起學習示例,例如聚合來自不同來源的 NASA Apache 網路日誌; 我們將通過查看加州的房地產數據來探索價格趨勢; 我們會編寫Spark應用程式,通過Stack Overflow調查數據找出不同國家開發者的工資中位數; 我們將開發一個系統來分析創客空間在英國不同地區的分佈情況。 還有更多。
你將從本次講座中學到什麼:
特別是,您將學習:
- Apache Spark 架構概述。
- 使用 RDD 轉換和操作以及 Spark SQL 使用 Java 開發 Apache Spark 2.0 應用程式。
- 使用 Apache Spark 的主要抽象、彈性分佈式資料集 (Resilient Distributed Datasets,RDD) 來處理和分析大型資料集。
- 深入研究通過分區、緩存和持久化 RDD 來優化和調整 Apache Spark 作業的高級技術。
- 通過 Amazon 的 Elastic MapReduce 服務在 Hadoop YARN 叢集上擴展 Spark 應用程式。
- 使用數據集和數據幀分析結構化和半結構化資料,並深入了解 Spark SQL。
- 通過廣播變量和累加器在 Apache Spark 叢集上的不同節點之間共享資訊。
在現場使用 Apache Spark 的最佳實踐。 - 大數據生態系統概述。
我們為什麼要學習 Apache Spark:
Apache Spark 賦予我們構建尖端應用程式的無限能力。 就其對大數據世界的破壞而言,它也是過去十年中最引人注目的技術之一。
Spark 提供記憶體內叢集計算,極大地提高了迭代演算法和互動式資料探勘任務的速度。
Apache Spark 是下一代大數據處理引擎。
大量公司正在採用 Apache Spark 從海量資料集中提取意義,今天您可以直接在桌面上訪問相同的大數據技術。
Apache Spark 正在成為大數據工程師和數據科學家的必備工具。
關於作者:
自 2015 年以來,James 一直在幫助他的公司採用 Apache Spark 來構建他們的大數據處理管道和數據分析應用程式。
James 的公司通過在生產中採用 Apache Spark 獲得了巨大的收益。 在本課程中,他將與您分享他多年在實際領域使用 Spark 的知識和最佳實踐。
為什麼選擇這門課程?
這門課程非常實用,James 付出了很多努力,不僅為您提供理論,還為您提供開發 Spark 應用程式的實際示例,您可以在自己的筆記本電腦上試用這些應用程式。
James 已將所有原始碼上傳到 Github,您可以在 Windows、MAC OS 或 Linux 上進行操作。
在本課程結束時,James 相信您將深入了解 Spark 以及一般的大數據分析和資料操作技能。 您將能夠開發 Spark 應用程式,在您的筆記本電腦和使用 Amazon 的 Elastic MapReduce 服務的雲端中分析千兆字節( Gigabytes )規模的數據!
30天退款保證!
對於本課程,您將從 Udemy 獲得 30 天退款保證。
如果不滿意,只需在 30 天內申請退款。 您將獲得全額退款。 沒有問任何問題。
您準備好將您的大數據分析技能和職業提升到一個新的水平了嗎,現在就來學習這門課程吧!
您將在 4 小時內從零變成 Spark 英雄。
目標受眾
- 任何想要完全了解 Apache Spark 技術如何工作並了解 Apache Spark 如何在該領域中使用的人。
- 想要使用 Spark Core 和 Spark SQL 開發 Apache Spark 2.0 應用程式的軟體工程師。
- 希望通過提高大數據處理技能來提升職業生涯的資料科學家或資料工程師。
講師介紹
Tao W. 軟體工程師
Tao 是一位充滿激情的軟體工程師,就職於矽谷領先的大數據分析公司。
此前,Tao 曾在 IBM 和 Tao 等大型 IT 公司工作。
Tao 擁有 University of McGill 計算機科學碩士學位,並在各種計算機科學課程中擔任助教多年。
工作之餘,Tao 喜歡閱讀和游泳,他還是一位充滿激情的攝影師。
James Lee 矽谷軟體工程師
James Lee 是一位充滿激情的軟體奇才,在矽谷一家專注於大數據分析的頂級新創公司工作。
過去曾在谷歌、亞馬遜等大公司工作
在他的日常工作中,他與 Cassandra 和 ElasticSearch 等大數據技術打交道,他是絕對的 Docker 技術極客和 IntelliJ IDEA 愛好者,非常注重效率和簡單性。
除了他作為軟體工程師的職業生涯外,他還熱衷於與他人分享他的知識並指導他們,尤其是在創業和程式編輯方面。 他從 21 歲起就一直在教授 Java 編程/IntelliJ IDEA 課程並舉辦研討會。
他喜歡與 Udemy 合作,因為在這裡他可以與更廣泛的受眾分享他所有的領域知識和秘密。 他希望學生們一定會從他多年的經驗中受益。 學生們會對與 James 和 Udemy 的交往感到興奮。 我們也很高興您能加入。
James Lee 擁有 University of McGill 計算機科學碩士學位,並在各種計算機科學課程中擔任助教多年。
James Lee 還喜歡滑雪和游泳,他是一個充滿熱情的旅行者。
Level Up 您的專業學習夥伴
在這個以數字為中心的世界中,熟練的程式設計師仍然需求量很大。
Level-up 提供實用且引人入勝的學習解決方案,徹底改變了專業在線培訓。
Level-up 提供頂級行業專家授課和精心設計的真人課程專案
我們以工業界使用的方式教授技術。
我們提供一系列課程,教授您從編程基礎知識到大數據和 DevOps、資料科學和 Apache Spark 等領域的高級主題
Level-up Udemy 課程是您通往行業專家和影響者的高品質軟體課程的門戶。
- 點選這個✨優惠連結✨ 課程特價 | Udemy 永久擁有課程 NT390 起( 在電腦瀏覽器登入,點選“優惠連結”後再回想要的課程介紹中點選“報名參加課程”即可取得 )
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程
也許你會有興趣
- 更多 Apache Spark 線上課程介紹
- 更多 Java 線上課程介紹
- 更多資料科學與機器學習相關課程
- 使用 e-mail 訂閱 Soft & Share 內容發布 – 透過 e-mail 提早收到 Soft & Share 發布的好康訊息!
- Soft & Share 特價課程與學習資訊分享 加入這個社團追蹤特價課程與學習資訊
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入
你必須登入才能發表留言。