Contents
對於已有 Python 基礎,熟悉機器學習演算法的人,本課程將帶你從初階到高階,了解如何選擇特徵並建構更簡單、更快速、更可靠的機器學習模型。
從這 3.5 小時的課程,你會學到
- 了解特徵選擇的不同方法
- 實現不同的特徵選擇方法
- 減少資料集中的特徵空間
- 構建更簡單、更快、更可靠的機器學習模型
- 分析並理解所選特徵
要求
- Python 安裝
- Jupyter 筆記本安裝
- Python 程式設計技能
- 一些 Numpy 和 Pandas 的經驗
- 熟悉機器學習演算法
- 熟悉 scikit-learn
課程說明
了解如何選擇特徵並建構更簡單、更快速、更可靠的機器學習模型。
這是網路上提供相關特徵選擇方面最全面、最容易遵循的課程。 在本課程中,你將學習全球範圍內用於變數選擇的各種技術,這些技術是從資料競賽網站和白皮書、部落格和論壇以及作為資料科學家的教練的經驗中收集的。
你在此皆一觸可及,你將學會應用多種方法從資料集中選擇特徵。
課程起頭教授簡單而快速的方法,以快速篩選資料集並刪除冗餘和不相關的特徵。 然後進入更複雜的技術,這些技術在選擇變數時考慮變數間的互動、特徵重要性及其與機器學習演算法的互動。 最後,描述了資料競賽和產業中使用的具體技術。
講座包括對特徵選擇技術的解釋,使用它的基本原理以及程序( procedure )的優點和局限性。 它還包含完整的程式碼,你可下載使用並應用於你自己的資料集。
因此,本課程適合想學習如何從資料集中選擇特徵資料科學領域的初學者,也適合尋求提高技能水準的中級甚至高級資料科學家。
通過超過 50 場講座和 8 小時視訊教學,這門綜合課程涵蓋了變數選擇的各個方面。 在整個課程中,你將使用 Python 作為你的主要語言。
你還在等什麼? 今天就註冊,學習如何為機器學習選擇變數,並建構更簡單、更快、更可靠的學習模型。
目標受眾
- 希望了解如何為機器學習選擇變數的初學資訊科學家
- 想要提高機器學習特徵選擇經驗的中級資訊科學家
- 想要發現特徵選擇的替代方法的高級資訊科學家
- 將轉換到資料科學的軟體工程師和學者
- 進入資料科學領域的軟體工程師和學者
- 希望提高資料科學技能的資訊分析師
講師簡介
Soledad Galli 資料科學家 ( 更多講師主講課程介紹 )
Soledad Galli是保險和金融領域的領先資料科學家。 Soledad 幫助金融和保險公司建立機器學習模型,以評估信用風險並防止欺詐。她在資料科學的工作讓她獲得資料科學和分析方面的 Data Leaders awards 2018 。
Soledad Galli 擁有生物學碩士學位、生物化學博士學位,並在倫敦大學學院和馬克斯普朗克研究所等知名機構擔任研究科學家 8 年以上的經驗。 她在癌症研究和神經科學等不同領域有科學出版物,她的研究在許多場合被媒體報導過。
Soledad 還擁有布宜諾斯艾利斯大學生物化學教師 4 年以上的經驗,並曾在倫敦大學學院的研討會和教程中做出貢獻,並為多位理學碩士和博士學生提供指導。
在她的職業生涯中,她掌握了資料分析、程式設計和機器學習的技能,並幫助金融和保險公司建立機器學習模型,以評估信用風險並防止欺詐。 她定期在倫敦的資料科學社群的資料科學會議分享知識,她希望通過部落格、文章、線上講座和課程等平台,觸及更廣的資料科學社群。
Soledad 熱衷於從資料中提取資訊並將其轉化為有意義的故事,幫助資料科學家擴大知識面,並幫助公司制定更好的資料驅動決策。
歡迎隨時在 LinkedIn 上與她聯繫。
英文字幕:有
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
報名參加課程
也許你會有興趣
- 機器學習的特徵工程
- 更多機器學習相關線上課程/電子書介紹
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
✍ 不受社群推薦演算法影響,建議 Telegram/Discord/e-mail