學習過濾器、包裝器和嵌入式方法、遞歸特徵消除、窮舉搜尋、特徵改組等。
從這 5.5 小時的課程,你會學到
- 了解特徵選擇的過濾、嵌入和包裝方法
- 了解特徵選擇的混合方法
- 使用 Lasso 和決策樹選擇特徵
- 使用 Python 實現不同的特徵選擇方法
- 了解為什麼特徵越少越好
- 縮小資料集中的特徵空間
- 建立更簡單、更快速、更可靠的機器學習模型
- 分析並理解所選特徵
- 探索資料科學競賽中使用的特徵選擇技巧
要求
- Python 安裝
- Jupyter 筆記本安裝
- Python 程式設計技能
- 一些 Numpy 和 Pandas 的經驗
- 熟悉機器學習演算法
- 熟悉 scikit-learn
課程說明
歡迎來到「機器學習的特徵選擇」課程,這是目前最全面的線上特徵選擇課程。
在本課程中,您將學習如何選擇資料集中的變量,並建立更簡單、更快速、更可靠、更易於解釋的機器學習模型。
本課程適合哪些人?
您已經邁出了資料科學的第一步,了解最常用的機器學習模型,並且可能建立過一些基於線性迴歸或決策樹的模型。您熟悉資料預處理技術,例如刪除缺失資料、轉換變數、編碼分類變數。在此階段,您可能已經意識到許多資料集包含大量特徵,其中一些特徵完全相同或非常相似,有些特徵完全不具預測性,而有些特徵則很難區分。
您可能想知道如何找到最具預測性的特徵。哪些特徵可以保留,哪些特徵可以省略?您還想知道如何以專業的方式編寫這些方法。您可能已經在網路上搜尋過,發現關於特徵選擇的內容並不多。所以你開始好奇:科技公司究竟是如何運作的?
這門課程將幫助你!這是變數選擇領域最全面的線上課程。你將學習世界各地不同組織和資料科學競賽中使用的各種特徵選擇程序,以選出最具預測性的特徵。
你將學到什麼?
我根據科學論文、資料科學競賽以及我作為資料科學家的經驗,整理了一系列精彩的特徵選擇技巧。
具體來說,你將學習:
- 如何移除方差較小的特徵
- 如何識別冗餘特徵
- 如何基於統計檢定選擇特徵
- 如何根據模型性能變化選擇特徵
- 如何根據模型賦予的重要性找到預測特徵
- 如何優雅而專業地編寫程式
- 如何利用現有 Python 函式庫的強大功能進行特徵選擇
在整個課程中,您將學習針對上述每項任務的多種技術,並學習如何使用 Python、Scikit-learn、pandas 和 mlxtend,以優雅、高效且專業的方式實現這些技術。
完成本課程時,您將掌握各種工具來選擇和比較不同的特徵子集,並確定哪些子集能夠傳回最簡單但預測性最強的機器學習模型。這將幫助您最大限度地縮短將預測模型投入生產的時間。
這門全面的特徵選擇課程包含約 70 節課,影片長達約 8 小時,所有主題都包含 Python 程式碼範例,您可以將其用作參考和練習,並在自己的專案中重複使用。
此外,我會定期更新課程,以跟上 Python 程式庫的新版本,並在新技術出現時將其納入其中。
還在等什麼?立即註冊,擁抱特徵選擇的強大功能,建立更簡單、更快速、更可靠的機器學習模型。
目標受眾
- 希望了解如何為機器學習選擇變數的初學資訊科學家
- 想要提高機器學習特徵選擇經驗的中級資訊科學家
- 想要發現特徵選擇的替代方法的高級資訊科學家
- 將轉換到資料科學的軟體工程師和學者
- 進入資料科學領域的軟體工程師和學者
- 希望提高資料科學技能的資訊分析師
講師簡介
Soledad Galli 資料科學家 ( 更多講師主講課程介紹 )
大家好,我是 Sole。我是一名資料科學家和開源 Python 開發者,對教學和程式設計充滿熱情。
我教授中級和高級機器學習課程,涵蓋如何改善機器學習流程、更好地設計和選擇特徵、最佳化模型以及處理不平衡資料集等主題。
我是 Feature-engine(一個用於特徵工程和選擇的開源 Python 庫)的開發者和維護者,也是 Packt 的《Python 特徵工程指南》和《用 Python 進行機器學習中的特徵選擇》一書的作者。
我於 2018 年榮獲數據科學領袖獎,並於 2019 年入選數據科學和分析領域的「領英之聲」。
我曾在金融和保險公司擔任資料科學家,開發並投入生產機器學習模型,用於評估信用風險、處理保險索賠和防止詐欺。
我熱愛分享有關數據科學和機器學習的知識。正因如此,我才從事線上教學、開發和貢獻開源軟體,並在聚會上發言、撰寫部落格和參與播客。
我擁有生物學碩士學位和生物化學博士學位,並在倫敦大學學院和馬克斯普朗克研究所等知名機構擔任研究科學家超過 8 年。我還在布宜諾斯艾利斯大學教授生物化學超過 4 年,並指導碩士和博士生。
歡迎透過 LinkedIn 聯絡我、追蹤我的 Twitter 或造訪我們的網站,查看關於機器學習的部落格。
Train in Data Team 資料科學家 | 講師 | 軟體工程師
嗨,我們是一支由資料科學家和 Python 開發者組成的團隊,對教學和程式設計充滿熱情。
我們教授中級和高階機器學習課程,涵蓋如何改善機器學習流程、更好地設計和選擇特徵、最佳化模型以及處理不平衡資料集等主題。
我們是 Feature-engine(一個用於特徵工程和選擇的開源 Python 庫)的開發者,也是 Packt 的《Python 特徵工程指南》和《使用 Python 進行機器學習中的特徵選擇》一書的作者。
歡迎在 LinkedIn 上聯絡我們的主講講師,在 Twitter 上關注她,或造訪我們的網站查看有關機器學習的部落格。
英文字幕:有
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
- Udemy 永久擁有課程 NT310 起特價中(點擊連結看更多)
- ✨年訂閱每月 NT350( 限時優惠價NT245/月) 🌈 悠遊 Udemy 的 26000+ 門課,最大化學習 ( 原價 NT635/月 )
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程

也許你會有興趣
- 機器學習的特徵工程
- 更多機器學習相關線上課程/電子書介紹
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
發表迴響