使用 Python 實作資料科學、深度學習和機器學習

Amazon 令人印象最深刻的無疑是它的推薦系統,這個推薦系統背後原理就是靠機器學習和資料分析做到的,它可以根據用戶購買的書籍就知道用戶還會喜歡那些書籍然後不定期用 e-mail 通知用戶,這在目前許多電子商務網站都有的功能,但是 Amazon 在這方面可以說是領先者。這堂課的講師先前在 Amazon 上班,而且就是負責產品自動推薦系統,他也在知名電影推薦網站 IMDb 做過,在機器學習與資料分析共有 9 年以上的經驗,這堂課以實務為主,最好已經會 Python 基礎程式設計能力來上會比較好,數學至少要有高中程度,適合想要轉換跑道跨到資料分析與機器學習領域的程式設計師。這堂課在 Udemy 相當熱門,有 5 萬多人參加。

從這 12 的小時的課程,你會學到

  • 使用 iPython notebooks 開發
  • 了解統計量測例如標準差
  • 資料分佈視覺化,機率質量函數和概率密度函數
  • 使用 matplotlib 視覺化資料
  • 使用共變數(covariance)和相關度量
  • 應用條件機率來尋找相關特徵
  • 使用貝葉斯定理來識別誤判 ( false positives ) 
  • 使用線性回歸,多項式回歸和多元回歸進行預測
  • 了解複雜的多層次模型
  • 使用火車/測試和 K-fold 交叉驗證選擇正確的模型
  • 使用單純貝葉斯 ( Naive Bayes ) 建構垃圾郵件分類器
  • 使用決策樹來預測招聘決策
  • 使用 K-Means 分類和支援向量機(SVM)做分類資料 
  • 建立一個電影推薦系統使用基於項目和基於用戶的協同過濾
  • 使用 K-Nearest-Neighbor(KNN)預測分類
  • 使用主要元件分析(PCA)應用維數降低對花進行分類
  • 了解強化學習( reinforcement learning )  – 以及如何建立小精靈 ( PAC-MAN )機器人
  • 清理你的輸入資料以消除異常值
  • 使用 Apache Spark 的 MLLib 大規模 TF / IDF 來實現機器學習,分類和搜尋
  • 使用 T 測試和P值設計和評估A / B測試

規定為何?

  • 你將需要能夠執行 Enthought Canopy 1.6.2或更高版本的桌上型電腦(Windows,Mac或Linux)。本課程將引導你完成必要的免費軟體安裝。
  • 有程式設計或是編寫 script 經驗是必須的。
  • 至少需要高中水平的數學技能。
  • 本課程將介紹如何在基於Microsoft Windows的桌上型電腦上進行設置。雖然本課程中的程式碼將可以在其它作業系統上運行,但我們無法為它們提供特定作業系統的支援。

課程說明

資料科學家享受高薪工作之一,平均年薪為12萬美元,根據Glassdoor報告確實是如此。

如果你有一些程式設計或是編寫 script 的經驗,本課程將教你真正的資料科學家在科技行業使用的技術,並準備進入這個熱門的職涯。這個全面的課程包括68個講座,涵蓋將近9個小時的視訊,大多數主題包括動手做的 Python 程式設計示範,你可以用於參考和實踐。我將拿出我在 Amazon 和 IMDb 的9年的經驗,從頭到尾指導你,什麼是重要,什麼是不重要的。

本課程的主題來自於最大科技公司雇主的資料科學家工作列表的真實需求分析。我們將介紹實際雇主正在尋找的機器學習和資料採礦技術,包括:

  • Regression analysis
  • K-Means Clustering
  • Principal Component Analysis
  • Train/Test and cross validation
  • Bayesian Methods
  • Decision Trees and Random Forests
  • Multivariate Regression
  • Multi-Level Models
  • Support Vector Machines
  • Reinforcement Learning
  • Collaborative Filtering
  • K-Nearest Neighbor
  • Bias/Variance Tradeoff
  • Ensemble Learning
  • Term Frequency / Inverse Document Frequency
  • Experimental Design and A/B Tests

以及更多!還有一個關於機器學習的部分,使用Apache Spark,它可以將這些技術擴展到在計算叢群上分析的“大數據”。

如果你是Python的新手,不要擔心 – 課程從速成的課程開始。如果你以前做過一些程式設計,你應該可以很快學會它。本課程會給你示範如何在微軟 Windows PC 上設定; 這些範例程式也可以在 MacOS 或是 Linux 作業系統上執行,但是我無法提供你針對這些特定作業系統支援。

每個概念都用簡單的英語介紹,避免混淆的數學符號和術語。然後示範使用你可以實驗和構建的Python 程式碼,以及你可以保留以備將來參考的筆記。

如果你是一個程式設計師想要轉變成一個令人興奮的新職涯軌道,或是資料分析師尋求轉型到科技行業- 本課程將教你真實世界行業資料科學家使用的基本技術。我想你會喜歡它!

目標受眾是誰?

  • 想要轉換跑道到有利可圖的資料科學職涯發展的軟體開發人員或程式設計師將從本課程中學到很多東西。
  • 金融或其它非技術行業的資料分析人員如果想轉換到科技行業,可以使用本課程學習如何使用程式碼而不是工具來分析資料。但是,你需要一些以前的程式設計或是腳本(script)程式設計經驗才能成功。
  • 如果你以前沒有程式設計或是script編寫經驗,你不應該參加這個課程 – 。建議先學習一個Python入門課程

講師簡介 

Frank Kane在Amazon和IMDb工作了9年,開發和管理技術,自動向數億客戶提供產品和電影推薦,每時每刻。Frank在分佈式計算,資料挖掘和機器學習領域擁有17項專利。2012年,Frank離開成立了自己的公司Sundog Software,該公司專注於虛擬實境環境技術,並教會他/她人如何進行大數據分析。

英文字幕:有

  • 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To

課程網址♥找優惠折扣碼?| 課程討論專區
671576_a272_4

Sponsored by Udemy

也許你會有興趣

喜歡我們的分享嗎?歡迎使用以下的社群分享按鈕分享給你的朋友吧!

 

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步瞭解 Akismet 如何處理網站訪客的留言資料

Powered by WordPress.com.

Up ↑

%d 位部落客按了讚: