三專案系列 – 用於降雨預測的端到端機器學習

在這個由多部分組成的 liveProject 系列中,您將利用機器學習的力量來預測未來的降雨量。 澳洲氣象局在手動處理氣象資料方面遇到了困難,您面臨的挑戰是建立一個可以進行即時預測的端到端機器學習模型。 您將使用常見的 Python 資料工具來清理和分類資料集以進行分析、訓練和評估模型,然後使用 Flask 和 Heroku 將模型部署到遠端伺服器。 從頭到尾工作,或深入研究最能增強您技能的部分。

參加此 liveProject 系列需具備

這個 liveProject 適合那些想要擴展為機器學習準備資料的能力的 Python 資料科學家。 要開始此 liveProject,您需要熟悉以下內容:

工具

  • 基礎Python
  • 基本的 Pandas
  • 基礎 NumPy
  • 基礎 Matplotlib
  • 基本的Seaborn
  • 基礎 scikit-learn
  • 基本 Jupyter 筆記本

技巧

  • 機器學習基礎知識
  • 探索性分析的基礎知識

必備知識

基本 Python • 基本 pandas、Numpy、Matplotlib、seaborn 和 scikit-learn • 基本 Jupyter Notebook • 基本機器學習 • 基本探索性分析 • 基本 Joblib/Pickle • 基本 Flask、Heroku、pipenv/virtualenv

注意:專案 3 部署預測模型的最後一個里程碑使用 Heroku 部署已完成的應用程式。 Heroko 會產生費用。 存在間歇性使用,Eco 選項(5 美元)足以讓應用程式運行,因為 Eco 涵蓋 1000 小時,而我們將使用遠少於此專案的時間。

此系列涵蓋

Project 1 Train a Binary ClassifierProject 2 Evaluate a Binary ClassifierProject 3 Deploy a Predictive Model
在這個 liveProject 中,您將探索預先製作的氣象記錄資料集。 您將了解手頭資料的形狀、大小和類型,並發現影響降雨的因素。 您可以使用 scikit-learn 和邏輯迴歸對未來降雨量進行初步預測,評估其準確性,並使用 Seaborn 和 Matplotlib 將新興模式視覺化。判斷機器學習模型的有效性需要深入分析。 這個快速的 liveProject 建立在您在分類機器學習中完成的工作的基礎上。 您將評估您的早期模型並考慮更好的替代方案。 您將繪製模型的 ROC 曲線,並將其與多個虛擬模型進行比較,並調整超參數以提供盡可能準確的結果。在此 liveProject 中,您將把機器學習模型部署到生產中,以便同事可以輕鬆使用它。 您將建立一個虛擬環境來部署應用程式,使用 Flask 建置返回預測的本機 Web 服務,並使用 Heroku 進行遠端部署。

你將學習

在此 liveProject 中,您將學習清理和探索資料的技能,為訓練機器學習模型做好準備。

  • 操縱資料和探索性分析
  • 估算缺失值( missing values )、工程異常值( engineering outliers )和 one-hot 編碼( encoding )
  • 評估預測、準確度和其他指標
  • 使用相關對圖( correlation pair plots )和熱圖( heatmaps )視覺化模式

你將學到的技能

操縱資料並進行探索性分析 • 輸入缺失值 • 設計異常值 • 評估預測與準確性 • 使用類別視覺化模式 • 進行超參數調整 • 為生產部署準備模型 • 建立虛擬環境 • GET 與 POST 請求 • 為預測應用程式• 在Heroku 上遠端部署應用程式

書籍和影片資源

當您開始本系列中的每個專案時,您將獲得以下書籍和影片的完全存取權限,為期 90 天。

Machine Learning in ActionMachine Learning, Data Science, and Deep Learning with PythonReal-World Machine LearningMachine Learning Bootcamp

本 liveProject 作者

Harshit Tyagi

Harshit Tyagi 已幫助一千多名學生掌握程式設計和資料科學的基礎知識。 在 OpenClassrooms 和 Coding Ninjas 任職期間,他利用自己的技術專業知識舉辦研討會並幫助學生完成課程專案。 他還有一個 YouTube 頻道,介紹資料科學和 Python 的基本概念、面試技巧等。 除了專注於資料科學教育外,Harshit 還與耶魯大學、麻省理工學院和加州大學洛杉磯分校的研究科學家一起開發資料處理演算法。

到 Manning 看更多與加入專案

liveProject 特性

自訂進度
您可以選擇時間表並決定在建立專案時投入多少時間。

專案路線圖
每個專案都分為幾個可實現的步驟。

得到幫助
在 liveProject 平台內,獲得其他參與者和我們的專家導師的協助。

與其他人比較
對於每個步驟,將您的可交付成果與作者和其他參與者的解決方案進行比較。

圖書資源
獲得精選書籍的 90 天完整存取權限。 還包括永久訪問 Manning (曼寧)產品摘錄以及其他資源的引用。

Sponsored by Manning


也許你會有興趣

不受 FB 演算法影響,歡迎透過 e-mail 訂閱網站更新

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

由 WordPress.com 建置.

Up ↑

探索更多來自 Soft & Share 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading