Hadoop、MapReduce 的實踐練習和「平行」思維的藝術
從這 13.5 小時的課程,你會學到
- 開發先進的 MapReduce 應用程式來處理大數據
- 掌握「平行思維」( “think parallel” )的藝術——如何將任務分解為 Map/Reduce 轉換
- 自行建立自己的微型 Hadoop cluster(叢集),無論是單一節點、實體 cluster 或在雲端。
- 使用 Hadoop + MapReduce 解決各種各樣的問題:從 NLP 到倒排索引再到推薦
- 了解 HDFS、MapReduce 和 YARN 以及它們如何相互作用
- 了解效能調優和管理叢集的基礎知識
要求
- 您需要一個 IDE,可以在其中編寫 Java 程式碼或開啟共享的原始程式碼。 IntelliJ 和 Eclipse 都是不錯的選擇。
- 您需要具備一些物件導向程式設計的背景,最好是 Java。所有原始碼都是 Java 語言,我們直接進入,無需深入物件( objects )、類別( classes )等
- 接觸一點 Linux/Unix shell 會有幫助,但不會成為阻礙
課程說明
授課團隊由 4 人組成,其中包括 2 名史丹佛大學畢業生、前谷歌員工和 2 名前 Flipkart 首席分析師。該團隊擁有數十年使用 Java 和處理數十億行資料的實務經驗。
本課程是涉及 Hadoop、MapReduce 和平行思維藝術的放大、縮小和實踐練習。
讓我們來分析一下。
放大,縮小( Zoom-in, Zoom-Out ):本課程既廣泛又深入。它詳細介紹了 Hadoop 的各個元件,並且還為您提供了它們如何相互作用的更高層次的圖景。
涉及 Hadoop、MapReduce 的實作練習:本課程將讓您很早就開始實踐 Hadoop。 您將學習如何使用虛擬機器和雲端來設定自己的叢集。涵蓋了 MapReduce 的所有主要功能 – 包括總體排序和二次排序等高級主題。
平行思維的藝術:MapReduce 徹底改變了人們處理大數據的思考方式。將任何問題分解為可平行化的單元是一門藝術。本課程中的範例將訓練您「平行思維」。
涵蓋的內容:
很多很酷的東西…
- 運用 MapReduce
- 在社群網站上推薦好友:使用協同過濾演算法產生前 10 個好友推薦。
- 為搜尋引擎建立倒排索引:使用 MapReduce 並行執行為搜尋引擎建立倒排索引的艱鉅任務。
- 從文字產生二元詞組:產生二元詞組並計算它們在文本語料庫中的頻率分佈。
- 建立您的 Hadoop 叢集:
- 以獨立、偽分散式和完全分散式模式安裝 Hadoop
- 使用 Linux VM 設定 Hadoop 叢集。
- 使用 Cloudera Manager 在 AWS 上設定雲端 Hadoop 叢集。
- 了解 HDFS、MapReduce 和 YARN 及其互動
- 自訂您的 MapReduce 工作:
- 將多個 MR 工作連結在一起
- 編寫您自己的自訂分區器
- 總體排序:透過對輸入檔進行採樣,對大量資料進行全域排序
- 二次排序
- 使用 MR Unit 進行單元測試
- 使用 Hadoop Streaming API 與 Python 整合
..當然還有所有基礎知識:
- MapReduce:Mapper、Reducer、排序/合併、分區( Partitioning )、Shuffle 和排序
- HDFS 和 YARN:Namenode、Datanode、資源管理器、節點管理器、MapReduce 應用程式的結構、YARN 調度、配置 HDFS 和 YARN 以調整叢集效能。
目標受眾
- 是的!在傳統資料庫不再適用的情況下,想要利用 HDFS 強大功能的分析師
- 是的!想要開發複雜的分散式運算應用程式來處理大量資料的工程師
- 是的!想要將 MapReduce 加入資料處理技巧的資料科學家
講師簡介
Loony Corn 前谷歌、史丹佛和 Flipkart 團隊
Loonycorn 是我們,Janani Ravi 和 Vitthal Srinivasan。我們曾在史丹佛大學學習,被印度管理學院艾哈邁達巴德分校錄取,並在灣區、紐約、新加坡和班加羅爾從事科技工作多年。
Janani:在Google工作 7 年(紐約、新加坡);在史丹佛大學學習;也曾在 Flipkart 和微軟工作過
Vitthal:也曾在Google(新加坡)工作並在史丹佛大學學習; Flipkart、瑞士信貸和 INSEAD 也是如此
我們認為我們可能已經找到了一種以有趣、實用、引人入勝的方式教授複雜技術課程的巧妙方法,這就是我們如此興奮加入 Udemy 的原因!
我們希望您能嘗試我們的產品,並相信您會喜歡它們:-)
字幕:英文
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
- Udemy 永久擁有課程 NT290起特價中(點擊連結看更多)
- ✨年訂閱每月 NT350( 限時優惠價NT262/月) 🌈 悠遊 Udemy 的 26000+ 門課,最大化學習 ( 原價 NT635/月 )
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程

也許你會有興趣
- Big Data 相關線上課程
- Hadoop 相關線上課程
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入
發表迴響