在這個由多部分組成的 liveProject 系列中,您將利用機器學習的力量來預測未來的降雨量。 澳洲氣象局在手動處理氣象資料方面遇到了困難,您面臨的挑戰是建立一個可以進行即時預測的端到端機器學習模型。 您將使用常見的 Python 資料工具來清理和分類資料集以進行分析、訓練和評估模型,然後使用 Flask 和 Heroku 將模型部署到遠端伺服器。 從頭到尾工作,或深入研究最能增強您技能的部分。
參加此 liveProject 系列需具備
這個 liveProject 適合那些想要擴展為機器學習準備資料的能力的 Python 資料科學家。 要開始此 liveProject,您需要熟悉以下內容:
工具
- 基礎Python
- 基本的 Pandas
- 基礎 NumPy
- 基礎 Matplotlib
- 基本的Seaborn
- 基礎 scikit-learn
- 基本 Jupyter 筆記本
技巧
- 機器學習基礎知識
- 探索性分析的基礎知識
必備知識
基本 Python • 基本 pandas、Numpy、Matplotlib、seaborn 和 scikit-learn • 基本 Jupyter Notebook • 基本機器學習 • 基本探索性分析 • 基本 Joblib/Pickle • 基本 Flask、Heroku、pipenv/virtualenv
注意:專案 3 部署預測模型的最後一個里程碑使用 Heroku 部署已完成的應用程式。 Heroko 會產生費用。 存在間歇性使用,Eco 選項(5 美元)足以讓應用程式運行,因為 Eco 涵蓋 1000 小時,而我們將使用遠少於此專案的時間。
此系列涵蓋
| Project 1 Train a Binary Classifier | Project 2 Evaluate a Binary Classifier | Project 3 Deploy a Predictive Model |
![]() | ![]() | ![]() |
| 在這個 liveProject 中,您將探索預先製作的氣象記錄資料集。 您將了解手頭資料的形狀、大小和類型,並發現影響降雨的因素。 您可以使用 scikit-learn 和邏輯迴歸對未來降雨量進行初步預測,評估其準確性,並使用 Seaborn 和 Matplotlib 將新興模式視覺化。 | 判斷機器學習模型的有效性需要深入分析。 這個快速的 liveProject 建立在您在分類機器學習中完成的工作的基礎上。 您將評估您的早期模型並考慮更好的替代方案。 您將繪製模型的 ROC 曲線,並將其與多個虛擬模型進行比較,並調整超參數以提供盡可能準確的結果。 | 在此 liveProject 中,您將把機器學習模型部署到生產中,以便同事可以輕鬆使用它。 您將建立一個虛擬環境來部署應用程式,使用 Flask 建置返回預測的本機 Web 服務,並使用 Heroku 進行遠端部署。 |
你將學習
在此 liveProject 中,您將學習清理和探索資料的技能,為訓練機器學習模型做好準備。
- 操縱資料和探索性分析
- 估算缺失值( missing values )、工程異常值( engineering outliers )和 one-hot 編碼( encoding )
- 評估預測、準確度和其他指標
- 使用相關對圖( correlation pair plots )和熱圖( heatmaps )視覺化模式
你將學到的技能
操縱資料並進行探索性分析 • 輸入缺失值 • 設計異常值 • 評估預測與準確性 • 使用類別視覺化模式 • 進行超參數調整 • 為生產部署準備模型 • 建立虛擬環境 • GET 與 POST 請求 • 為預測應用程式• 在Heroku 上遠端部署應用程式
書籍和影片資源
當您開始本系列中的每個專案時,您將獲得以下書籍和影片的完全存取權限,為期 90 天。
| Machine Learning in Action | Machine Learning, Data Science, and Deep Learning with Python | Real-World Machine Learning | Machine Learning Bootcamp |
![]() | ![]() | ![]() | ![]() |
本 liveProject 作者
Harshit Tyagi
Harshit Tyagi 已幫助一千多名學生掌握程式設計和資料科學的基礎知識。 在 OpenClassrooms 和 Coding Ninjas 任職期間,他利用自己的技術專業知識舉辦研討會並幫助學生完成課程專案。 他還有一個 YouTube 頻道,介紹資料科學和 Python 的基本概念、面試技巧等。 除了專注於資料科學教育外,Harshit 還與耶魯大學、麻省理工學院和加州大學洛杉磯分校的研究科學家一起開發資料處理演算法。
liveProject 特性
自訂進度
您可以選擇時間表並決定在建立專案時投入多少時間。
專案路線圖
每個專案都分為幾個可實現的步驟。
得到幫助
在 liveProject 平台內,獲得其他參與者和我們的專家導師的協助。
與其他人比較
對於每個步驟,將您的可交付成果與作者和其他參與者的解決方案進行比較。
圖書資源
獲得精選書籍的 90 天完整存取權限。 還包括永久訪問 Manning (曼寧)產品摘錄以及其他資源的引用。


也許你會有興趣
- 機器學習與資料科學相關線上課程與電子書
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入







發表迴響