fbpx

精通 Python 的資料清洗專業課程

機器學習工程師資料清理完整指南

從這 3.5 小時的課程,你會學到

  • 你將學習資料插補( data imputation )和高級資料清理( data cleansing )技術。
  • 你將學習如何將真實世界的資料清理技術應用到你的資料上。
  • 你將學習高級資料清理技術。
  • 你將學習如何以一種避免資料洩漏的方式準備資料,進而避免不正確的模型評估。

要求

  • 你需要一個非常紮實的 Python 基礎。
  • 你需要了解機器學習的基礎知識。

課程說明

歡迎來到 “ 精通 Python 的資料清洗專業課程 ”。

資料準備可能是機器學習專案中最重要的部分。 這是最耗時的部分,儘管它似乎是討論最少的話題。 資料準備,有時稱為資料預處理,是將原始資料轉換為適合建模的形式的行為。

機器學習演算法要求輸入的資料是數字,大多數演算法實現都在這種期望下。 因此,如果你的資料包含非數字的資料類型和值,例如標籤,你將需要將資料更改為數字。 此外,特定的機器學習演算法對資料類型、規模、機率分佈和輸入變數之間的關係有預期,你可能需要更改資料以滿足這些預期。

在課程中,你將學習:

  • 資料準備對預測建模機器學習專案的重要性。
  • 如何以一種避免資料洩漏的方式準備資料,進而避免不正確的模型評估。
  • 如何識別和處理雜亂資料的問題,例如異常值和缺失值。
  • 如何使用特徵選擇方法識別和刪除不相關和冗餘的輸入變數。
  • 如何根據變數的資料類型知道選擇哪種特徵選擇方法。
  • 如何使用標準化和標準化技術來縮放輸入變數的範圍。
  • 如何將分類變數編碼為數字,將數值變數編碼為類別。
  • 如何轉換輸入變數的機率分佈。
  • 如何轉換具有不同變數類型的資料集以及如何轉換目標變數。
  • 如何將變量投射到擷取顯著資料關係的低維空間中。

本課程是一個動手指南。 它是一本劇本和工作手冊,旨在讓你邊做邊學,然後將你的新理解應用於 Python 中的特徵工程。 為了充分利用課程,我建議你完成每個教程中的所有示例。 如果你像看電影一樣看這門課程,你將無法從中受益。

在應用領域,機器學習是程式設計,而程式設計是一項動手運動。

感謝你對本課程的興趣。

讓我們開始吧!

目標受眾

你很想成為現實世界中的機器學習工程師。

講師簡介

Mike West LogikBot的創造者

我是 LogikBot 的創始人。我曾在 Microsoft 和 Uber 工作過。我幫助設計了 Microsoft 的資料科學認證課程。如果你對機器學習感興趣,我可以提供幫助。

我從事資料庫工作已有二十多年了。作為全職員工或顧問,我曾為 50 多家不同的公司工作或諮詢過。財富 500 強以及幾家中小型公司。其中包括:Georgia Pacific、SunTrust、Reed Construction Data、Building Systems Design、NetCertainty、The Home Shopping Network、SwingVote、Atlanta Gas and Light 和 Northrup Grumman。

在過去的五年裡,我已經過渡到了令人興奮的應用機器學習世界。我很高興向你展示我所學到的知識,並幫助你進入該領域中最重要的領域之一。

經驗、教育和熱情

我幾乎每天都學到一些東西。我和非常聰明的人一起工作。我是 SQL Server 的所有事物的狂熱學習者,並且熱衷於分享我所學到的知識。我專注的領域是性能調整。 SQL Server 就像一輛異國情調的跑車,它在任何人的手中都可以正常運行,但如果放在熟練的調校師手中,它就會像賽車一樣運行。

認證

證書就像大學學位,是開始學習的一個很好的起點。我是 Microsoft 認證資料庫管理員 (MCDBA)、Microsoft 認證系統工程師 (MCSE) 和 Microsoft 認證培訓師 (MCT)。

個人的

我出生在俄亥俄州,在賓夕法尼亞州長大並接受教育,目前與妻子和兩個孩子住在亞特蘭大。

英文字幕:有

  • 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To

使用 Notion 來做上課筆記?

udemy 的課程講座數量動輒上百個,如果你要使用 Notion 當作是線上課程的筆記輔助工具,為這些講座建立與組織筆記是一件耗時且沒效率的工作

為了解決這個問題,Soft & Share 開發一個 chrome extension – LN+ for udemy ,可以根據 udemy 線上課程的課程大綱幫你自動建立成 Notion 筆記資料庫並產生筆記與課程的雙向關聯讓您專心上課與寫筆記就好,不用再煩惱課程筆記要放哪裡的問題!

🛫了解 LN+ for udemy 更多功能介紹請參考 – Learning Notes Plus for udmy


報名參加課程

Sponsored by Udemy


🛫使用關鍵字連結獲得更多線上學習資訊?請參考這個網頁說明


幫我們個小忙!

使用 e-mail 追蹤 Soft & Share

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

Powered by WordPress.com.

Up ↑

%d 位部落客按了讚: