Contents
學習對資料進行過採樣(over-sample )和欠採樣( under-sample )、應用 SMOTE、集成方法( ensemble methods )和成本敏感型學習。
從這 11.5 小時的課程,你會學到
- 應用隨機欠採樣( under-sampling )從多數類( classes )中刪除觀察結果
- 通過刪除難以分類的觀察來執行欠採樣( under-sampling )
- 通過在類分離( class separation )的邊界( boundary )保留觀察值來進行欠採樣( under-sampling )
- 應用隨機過採樣( over-sampling )來增加少數類( class )
- 創建綜合資料以增加少數類( class )的示例
- 實施 SMOTE 及其變體以綜合生成資料
- 使用集成方法和採樣技術來提高模型性能
- 更改模型優化的錯誤分類成本以適應少數類( classes )
- 使用最適合不平衡資料集的指標確定模型性能
要求
- 了解機器學習基本演算法,即迴歸( regression )、決策樹( decision trees )和最近鄰( nearest neighbours )
- Python 程式設計,包括熟悉 NumPy、Pandas 和 Scikit-learn
- Python 和 Jupyter 筆記本安裝
課程說明
歡迎使用不平衡資料集進行機器學習。 在本課程中,你將學習多種可用於不平衡資料集的技術,以提高機器學習模型的性能。
如果你現在正在處理不平衡的資料集並希望提高模型的性能,或者你只是想了解有關如何解決資料不平衡的更多資訊,本課程將向你展示如何解決。
我們將通過引人入勝的視訊教學逐步指導你,並教你有關使用不平衡資料集的所有知識。 在這門綜合課程中,我們幾乎涵蓋了處理不平衡資料集的所有可用方法,討論了它們的邏輯、它們在 Python 中的實現、它們的優點和缺點,以及使用該技術時的注意事項。 具體來說,你將學習:
- 隨機欠採樣或側重於突顯某些樣本群體的抽樣方法
- 隨機過採樣方法以及根據現有觀察創建新示例的方法
- 利用多個弱學習器的力量與採樣技術相結合來提高模型性能的集成方法
- 成本敏感的方法,對少數群體的錯誤決定進行更嚴厲的懲罰
- 在不平衡資料集上評估模型性能的適當指標
完成課程時,你將能決定哪種技術適合你的資料集,和/或應用和比較不同方法在多個資料集上返回的性能改進。
這個全面的機器學習課程包括超過 50 場講座,涵蓋超過 10 個小時的視訊,所有主題都包括動手 Python 程式碼示例,你可以將其用作參考和練習,並在你自己的專案中重複使用。
此外,程式碼會定期更新,以跟上新趨勢和新 Python 程式庫的發布。
你還在等什麼? 立即註冊,了解如何處理不平衡資料集並建構更好的機器學習模型。
目標受眾
- 處理不平衡資料集的資料科學家和機器學習工程師
- 希望提高在不平衡資料集上訓練的模型性能的資料科學家
- 想要學習機器學習中級內容的學生
- 處理不平衡的多類目標( multi-class targets )的學生
講師簡介
Soledad Galli 資料科學家 ( 更多講師主講課程介紹 )
Soledad Galli是保險和金融領域的領先資料科學家。 Soledad 幫助金融和保險公司建立機器學習模型,以評估信用風險並防止欺詐。她在資料科學的工作讓她獲得資料科學和分析方面的 Data Leaders awards 2018 。
Soledad Galli 擁有生物學碩士學位、生物化學博士學位,並在倫敦大學學院和馬克斯普朗克研究所等知名機構擔任研究科學家 8 年以上的經驗。 她在癌症研究和神經科學等不同領域有科學出版物,她的研究在許多場合被媒體報導過。
Soledad 還擁有布宜諾斯艾利斯大學生物化學教師 4 年以上的經驗,並曾在倫敦大學學院的研討會和教程中做出貢獻,並為多位理學碩士和博士學生提供指導。
在她的職業生涯中,她掌握了資料分析、程式設計和機器學習的技能,並幫助金融和保險公司建立機器學習模型,以評估信用風險並防止欺詐。 她定期在倫敦的資料科學社群的資料科學會議分享知識,她希望通過部落格、文章、線上講座和課程等平台,觸及更廣的資料科學社群。
Soledad 熱衷於從資料中提取資訊並將其轉化為有意義的故事,幫助資料科學家擴大知識面,並幫助公司制定更好的資料驅動決策。
歡迎隨時在 LinkedIn 上與她聯繫。
英文字幕:有
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
- 點選這個✨優惠連結✨ ( NT390 起特價中 ) | Udemy 永久擁有課程 ( 在電腦瀏覽器登入,點選“優惠連結”後再回想要的課程介紹中點選“報名參加課程”即可取得 )
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程

也許你會有興趣
- Data Science 相關線上課程與電子書
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入
發表迴響