fbpx

Python 的不平衡分類大師班

處理機器學習中真實世界類不平衡的分步指南

從這 3 小時的課程,你會學到

  • 在彌合一系列機器學習模型時,如何使用 SMOTE 等資料採樣演算法將訓練資料集轉換為不平衡資料集
  • 成本敏感學習領域的演算法如何用於不平衡分類
  • 如何使用 SVM 和決策樹等標準演算法的修改版本來考慮類權重
  • 將預測機率轉譯為類別標籤( class labels )時如何調整臨界值
  • 如何校準不適合使用機率框架的非線性演算法預測的機率
  • 如何使用異常值檢測和異常檢測領域的演算法進行不平衡分類
  • 如何在訓練期間使用已修改的修改合成演算法以考慮類別分佈( class distribution )
  • 如何系統地完成一個不平衡的分類預測建模專案

要求

  • 你需要在機器學習方面打下堅實的基礎
  • 你需要紮實的 Python 基礎
  • 熟悉分類問題將是理想的

課程說明

歡迎來到 Python 中的不平衡分類大師班。

分類預測建模是將標籤分配給示例的任務。 不平衡分類是指樣本在類中的分佈不均等的分類任務。 通常,類分佈嚴重偏斜,因此對於少數類別中的每個示例,多數類別可能有一百甚至一千個示例。 實際的不平衡分類需要使用一套專門的技術、資料準備技術、學習演算法和性能指標。

讓我們看看你將在本課程中學到什麼 :

  • 不平衡分類資料集的挑戰和直覺。
  • 如何選擇適當的性能指標來評估不平衡分類的模型。
  • 如何在拆分為訓練集和測試集以及使用 k 折交叉驗證( k-fold cross-validation )時對不平衡的資料集進行適當的分層( stratify )。
  • 在擬合一系列標準機器學習模型時,如何使用 SMOTE 等資料採樣算法將訓練資料集轉換為不平衡資料集。
  • 成本敏感學習領域的演算法如何用於不平衡分類。
  • 如何使用 SVM 和決策樹等標準演算法的修改版本來考慮類權重。
  • 在將預測概率解釋為類別標籤時如何調整臨界值。
  • 如何校準不適合使用機率框架的非線性演算法預測的機率。
  • 如何使用異常值檢測和異常檢測領域的演算法進行不平衡分類。
  • 如何使用修改後的合成演算法,以便在訓練期間考慮類別分佈。
  • 如何系統地完成一個不平衡的分類預測建模專案。

本課程的創建是為了線性完成,從開始到結束。 話雖如此,如果你了解基礎知識並在特定方法或問題類型方面需要幫助,那麼你可以直接跳到該部分並開始使用。 本課程旨在讓你在筆記本電腦或台式機上、在螢幕上完成,而不是在平板電腦上完成。

我希望你在你的編輯器旁邊打開課程並在你閱讀示例時運行示例。 本課程不打算被動完成或作為參考文本放置在檔案夾中。 它是一本劇本、工作手冊和指南,旨在讓你邊做邊學,然後將你的新理解應用到工作 Python 示例中。 為了充分利用課程,我建議你使用每個教程中的。 對這些示例做擴展、分解與修復。

感謝你對 Python 中的不平衡分類大師班感興趣。

現在讓我們開始吧!

目標受眾

  • 如果你正在學習成為一名機器學習工程師,那麼本課程適合你。
  • 如果你是機器學習工程師,那麼本課程適合你。
  • 如果你正轉職到機器學習的資料科學家,那麼本課程適合你。

講師簡介

Mike West LogikBot 的創始

我是 LogikBot 的創始人。我曾在 Microsoft 和 Uber 工作過。我幫助設計了 Microsoft 的資料科學認證課程。如果你對機器學習感興趣,我可以提供幫助。

我從事資料庫工作已有二十多年了。作為全職員工或顧問,我曾為 50 多家不同的公司工作或諮詢過。財富 500 強以及幾家中小型公司。其中包括:Georgia Pacific、SunTrust、Reed Construction Data、Building Systems Design、NetCertainty、The Home Shopping Network、SwingVote、Atlanta Gas and Light 和 Northrup Grumman。

在過去的五年裡,我已經過渡到了令人興奮的應用機器學習世界。我很高興向你展示我所學到的知識,並幫助你進入該領域中最重要的領域之一。

經驗、教育和熱情

我幾乎每天都學到一些東西。我和非常聰明的人一起工作。我是 SQL Server 的所有事物的狂熱學習者,並且熱衷於分享我所學到的知識。我專注的領域是性能調整。 SQL Server 就像一輛異國情調的跑車,它在任何人的手中都可以正常運行,但如果放在熟練的調校師手中,它就會像賽車一樣運行。

認證

證書就像大學學位,是開始學習的一個很好的起點。我是 Microsoft 認證資料庫管理員 (MCDBA)、Microsoft 認證系統工程師 (MCSE) 和 Microsoft 認證培訓師 (MCT)。

個人的

我出生在俄亥俄州,在賓夕法尼亞州長大並接受教育,目前與妻子和兩個孩子住在亞特蘭大。

英文字幕:有

  • 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To

使用 Notion 來做上課筆記?

udemy 的課程講座數量動輒上百個,如果你要使用 Notion 當作是線上課程的筆記輔助工具,為這些講座建立與組織筆記是一件耗時且沒效率的工作

為了解決這個問題,Soft & Share 開發一個 chrome extension – LN+ for udemy ,可以根據 udemy 線上課程的課程大綱幫你自動建立成 Notion 筆記資料庫並產生筆記與課程的雙向關聯讓您專心上課與寫筆記就好,不用再煩惱課程筆記要放哪裡的問題!

🛫了解 LN+ for udemy 更多功能介紹請參考 – Learning Notes Plus for udmy


報名參加課程

Sponsored by Udemy


🛫使用關鍵字連結獲得更多線上學習資訊?請參考這個網頁說明


幫我們個小忙!

使用 e-mail 追蹤 Soft & Share

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

Powered by WordPress.com.

Up ↑

%d 位部落客按了讚: