Contents
學習資料準備 |資料工程 |特徵編碼 |特徵正規化 |資料科學家的名列前茅的 5% 技能
從這 12 小時的課程,你會學到
- 使用 Python 掌握探索性資料分析 (Exploratory Data Analysis,EDA)
- 掌握如何處理凌亂的資料
- 掌握如何處理異常值
- 掌握如何處理丟失的資料
- 掌握如何處理資料洩露
- 了解如何處理糟糕的機器學習演算法和模型
- 知道如何在 Python 中處理複雜的資料清理問題
- 學習用於專業資料清理和分析的自動化現代工具和程式庫
- 獲得成為前 10% 資料分析和資料科學所需的技能
- 了解準備資料以建構機器學習模型的最佳方法
- 掌握處理原始資料的不同技術
- 執行行業級資料工程
- 學習特徵編碼
- 學習特徵正規化( normalization )
- 任何準備學習如何處理複雜機器學習問題的學生,例如不平衡資料、資料洩漏、基礎到高級特徵工程等。
- One-Hot 編碼
- 標籤編碼
- 維度的詛咒
- 特徵 Harsher(哈希技巧)
- 特徵縮放( scaling )
- 標準化
- 強大的縮放器
- 特徵轉換
- 多項式變換
- 特徵工具
要求
這是一個初學者友好的課程,不需要任何先決條件
課程說明
您好,歡迎來到資料科學的特徵工程。
我的名字是 Bright 博士,我擁有資料科學博士學位,是微軟的前資料科學家和 WPI 的講師。
我的研究興趣是非基礎人工智慧、計算的機器學習和對話式人工智慧。最近,我對公司如何使用資料科學在不損害客戶隱私的情況下取得更多成果進行了更多研究。
我是“How to become a Full Stack Data Scientist”和“The Data Science Mindset”一書的作者
我將成為您在本課程中的首席講師。
據 Forbes 報導:“資料科學家或機器學習工程師 80% 的時間都花在清理和組織資料上……”作為一名擁有 8 年以上行業經驗的 Microsoft 資料科學家,我知道在建構機器學習模型之前執行正確的特徵工程有多重要。
建構機器學習模型只需要幾分鐘,但準備資料以構建強大的機器學習模型是區分優秀成功的資料科學家與糟糕的資料科學家的能力。
如果您的特徵工程技能有誤,那麼您的整個資料科學或機器學習過程都在浪費時間。
在本課程中,您不僅會了解執行特徵工程的行業級策略,而且我還將實際演示它們以便讓您更好地理解。
您將了解處理混亂資料的所有行業級策略。
我將逐步引導您了解每個主題,解釋每一行程式碼。
我們將從:
- 基本概念介紹
- 如何正確處理 python 中的資料類型
- 如何在 Python 中正確處理日期和時間
- 如何正確處理缺失值
- 如何正確處理異常值
- 如何正確處理資料不平衡
- 如何正確處理資料洩露
- 如何正確處理分類值
現在,在我們完成了這些基本概念之後,我們將從以下內容開始:
- 不同的特徵工程技術包括:
- 特徵編碼
- 特徵縮放
- 特徵轉換
- 特徵正規化
- 然後我們將繼續
- 自動探索性資料分析工具,例如
- panda-profiling
- Dora
- Autoviz
- Sweetviz
- 自動化特徵工程工具
- RFECV
- FeatureTools
- FeatureSelector
- Autofeat
因此,您會看到,在準備資料以建構強大的機器學習模型時,我們將涵蓋您需要了解的所有內容。
這是從初學者到高級課程,因此您不需要任何先決條件即可開始。
如果您真的有興趣成為一名資料科學家,並且擅長您的工作並在您的團隊中有價值,在您的職業生涯中取得成功,那麼這門課程適合你。
現在報名 !!
目標受眾
- 任何有興趣成為資料科學家的人
- 任何有興趣成為機器學習工程師的人
- 任何有興趣學習為建構機器學習演算法和模型準備資料的最佳方法的學生
- 任何有興趣了解行業中如何完成資料工程的人
講師簡介
Dr. Bright (PhD Data Science) 資料科學家和分析師
Bright 博士擁有資料科學博士學位,曾任微軟數據科學家和 WPI 講師。
他目前是大多數線上資料科學、機器學習、商業分析和資料分析課程的講師,為來自世界各地的 120,000 多名滿意的學生提供服務。
職位簡介:
- 微軟:資料科學家
- 亞馬遜:資料科學顧問
- 企業家
兩本書的作者:
- How To Become a Full Stack Data Scientist
- The Data Science Mindset ( free on Kindle )
英文字幕:有
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
🙌 如何有效率地管理 ChatGPT 輸出與整理自己的 ChatGPT 提示( prompts )使用情境?LN+ for Web 已經針對 ChatGPT 的整合做最佳化
🙌 讓 Notion AI 成為你線上學習的得力助手,詳細操作請參考 – 使用 Notion AI 功能來為 udemy 的課程做摘要總結
- 點選這個✨優惠連結 ,課程最低價 NT330 起( 登入後將看到 )
- 辦公室生產力課程特價連結
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程

你必須登入才能發表留言。