資料科學與機器學習—透過真實的心臟病分析專案提升您的機器學習和統計學技能
從這 7 小時的課程,你會學到
- 機器學習是指利用基於真實世界資料訓練的模型進行預測的系統。
- 機器學習的應用遠不止於預測簡訊或智慧型手機語音辨識。
- 資料科學運用演算法來理解原始數據。資料科學與傳統資料分析的主要區別在於其側重於預測。
- 資料科學包括資料的準備、分析和處理。它藉鑒了許多科學領域,並且作為一門科學,它透過創建新的演算法而不斷發展。
- 資料科學家利用機器學習來發現大量原始資料中隱藏的模式,從而揭示實際問題。
- 專案第一步
- 專案筆記本設計
- 專案主題探究
- 識別資料集中的變數
- 所需 Python 函式庫
- 載入資料集
- 資料集初步分析
- 檢查缺失值
- 檢查唯一值
- 分離變數(數值型或類別型)
- 檢查變數統計資訊
- 數值型變數(使用 Distplot 分析)
- 類別型變數(使用 Pie Chart 分析)
- 根據分析結果檢查缺失資料
- 數值型變數 – 目標變數(使用 FacetGrid 分析)
- 類別型變數 – 目標變數(使用 Count Plot 分析)
- 比較數值型變數之間的差異(使用 Pair Plot 分析)
- 使用 Robust Scaler 方法進行特徵縮放以產生新的視覺化圖表
- 使用 Melt() 函數建立新的 DataFrame
- 數值型變數 – 類別型變數(使用 Swarm 分析)圖表)
- 數值型變數 – 分類變數(箱線圖分析)
- 變數間關係(熱圖分析)
- 刪除低相關性列
- 可視化異常值
- 處理異常值
- 確定數值型變數的分佈
- 對非對稱資料進行轉換操作
- 將獨熱編碼方法應用於分類變數
- 使用穩健縮放器方法對機器學習演算法進行特徵縮放
- 將資料分為測試集和訓練集
- 邏輯迴歸
- 邏輯迴歸演算法的交叉驗證
- 邏輯迴歸演算法的 ROC 曲線和曲線下面積 (AUC)
- 邏輯迴歸演算法的超參數最佳化(使用 GridSearchCV)
- 決策樹演算法
- 支援向量機演算法
- 隨機森林演算法
- 隨機森林演算法的超參數最佳化(使用 GridSearchCV)
- 專案總結與分享
要求
- 渴望精通機器學習(從入門到精通)、Python、資料科學和統計學
- 掌握 Python 程式語言
- 熟悉 Python 中的資料視覺化函式庫,例如 Seaborn 和 Matplotlib
- 了解機器學習基礎知識
- 能夠操作和安裝電腦軟體
- 課程中使用的免費軟體和工具
- 學習的決心和耐心。
課程說明
機器學習、Python、統計學、資料科學、Python機器學習、Python資料科學、機器學習入門、資料科學家、R語言、Python資料科學 |
您好!
歡迎來到「機器學習計畫:心臟病預測分析」課程。
機器學習與資料科學 – 透過真實的心臟病預測實踐專案提升您的機器學習技能
機器學習是指利用基於真實世界資料訓練的模型進行預測的系統。例如,假設我們想要建立一個能夠辨識圖片中是否有貓的系統。首先,我們收集大量圖片來訓練機器學習模型。在訓練階段,我們將圖片以及圖片中是否包含貓的資訊輸入模型。在訓練過程中,模型會學習與貓最密切相關的圖像模式。然後,該模型可以使用訓練期間學習到的模式來預測新輸入的圖片中是否包含貓。在這個例子中,我們可能會使用神經網路來學習這些模式,但機器學習可以比這簡單得多。
機器學習課程教導您預測文字、虛擬助理和人工智慧背後的技術和概念。您可以透過 Python 和 R 程式語言,掌握建立神經網路和創建更複雜功能所需的基礎技能。機器學習培訓能幫助您跟上該領域的新趨勢、新技術和新應用。
我們擁有的數據比以往任何時候都多。但數據本身並不能告訴我們太多關於周遭世界的資訊。我們需要解讀訊息並發現隱藏的模式。這就是資料科學的用武之地。資料科學使用演算法來理解原始數據。資料科學與傳統資料分析的主要區別在於它側重於預測。資料科學旨在發現數據中的模式,並利用這些模式來預測未來的數據。它利用機器學習來處理大量數據、發現模式並預測趨勢。資料科學包括資料的準備、分析和處理。它藉鑒了許多科學領域,並且作為一門科學,它透過創建新的演算法來分析數據和驗證現有方法而不斷發展。
資料科學應用是全球眾多產業(包括金融、交通、教育、製造、人力資源和銀行業)的熱門技能。探索 Python、統計學、機器學習等資料科學課程,拓展您的知識。如果您對研究、統計和分析感興趣,不妨參加資料科學訓練。
您知道嗎?到 2026 年,資料科學領域將創造 1,150 萬個就業機會!
您知道嗎?資料科學從業人員的平均年薪高達 10 萬美元!
資料科學職業正在塑造未來
從政府安全到約會應用,幾乎所有領域都需要資料科學專家。數百萬家企業和政府部門依靠大數據取得成功,並更好地服務客戶。因此,資料科學人才需求旺盛。
- 想學習雇主最需要的技能之一嗎?
- 對資料科學充滿好奇,並希望用 Python 開啟你的資料世界自學之旅嗎?
- 經驗豐富的開發人員,正在尋找資料科學領域的發展機會嗎?
無論如何,您來對地方了!
我們為您精心設計了「基於真實心臟病預測專案的機器學習」課程,這是一門簡單易懂的 Python 程式語言和機器學習課程。
本課程將以簡單易懂的方式說明專案內容。透過本課程,您將從頭到尾完成一個資料科學專案。我運用真實案例,讓學習變得簡單易懂。
我們將帶您進入資料科學和機器學習的世界,並深入探索。您將學習機器學習的基礎知識及其強大的函式庫,例如 Scikit-learn。
在整個課程中,我們將教您如何使用 Python 分析資料、創建精美的視覺化圖表以及使用強大的機器學習演算法。
這門資料科學與機器學習課程適合所有人!
Python 是一種通用、進階且用途廣泛的程式語言。 Python 最棒的地方在於它支援當今眾多技術,包括龐大的 Twitter、資料探勘、科學計算、設計、網站後端伺服器、工程模擬、人工智慧、擴增實境等函式庫!此外,它還支援各種類型的應用程式開發。
你將學到什麼?
在本課程中,我們將從零開始,使用心臟病資料集,完整地學習「機器學習」。
每節課之前都會有理論講解部分。學習理論部分後,我們將透過實際案例來鞏固所學。
課程內容涵蓋以下主題:
- 介紹
- 專案第一步
- 專案用筆記本設計
- 專案主題探究
- 資料集中的變數識別
- 第一組織
- 所需的 Python 程式庫( libraries )
- 載入資料集
- 對資料集進行初步分析
- 為探索性資料分析( Exploratory Data Analysis,EDA) 做準備
- 檢查缺失值
- 檢查唯一值
- 分離變數(數值型或類別型)
- 檢查變數統計資訊
- Exploratory Data Analysis (EDA) – 單變量分析
- 數值變數(使用分佈圖進行分析):第一課
- 數值變數(使用分佈圖進行分析):第二課
- 分類變數(使用圓餅圖進行分析):第一課
- 分類變數(使用圓餅圖進行分析):第二課
- 根據分析結果檢查缺失數據
- Exploratory Data Analysis (EDA) – 雙變量分析
- 數值變數 – 目標變數(使用 FacetGrid 進行分析):第 1 課
- 數值變數 – 目標變數(使用 FacetGrid 進行分析):第 2 課
- 分類變數 – 目標變數(使用計數圖進行分析):第 1 課
- 分類變數 – 目標變數(使用計數圖進行分析):第 2 課
- 數值變數之間的相互關係分析(使用配對圖進行分析):第 1 課
- 數值變數之間的相互關係分析(使用配對圖進行分析):第 2 課
- 使用穩健縮放器方法進行特徵縮放
- 使用 Melt() 函數建立新的 DataFrame
- 數值-分類變數(使用群散圖進行分析):第 1 課
- 數值-分類變數(使用群散圖進行分析):第 2 課
- 數值-分類變數(使用箱型圖進行分析):第 3 課1
- 數值型變數與分類變數(箱型圖分析):第 2 課
- 變項間關係(熱圖分析):第 1 課
- 變項間關係(熱圖分析):第 2 課
- 建模的準備工作
- 刪除低相關性列
- 可視化異常值
- 處理異常值-Trtbps 變數:第一課
- 處理異常值-Trtbps 變數:第二課
- 處理異常值—Thalach 變數
- 處理異常值—Oldpeak 變數
- 確定數值變數的分佈
- 對非對稱資料進行變換
- 將獨熱編碼方法應用於分類變數
- 使用穩健縮放器方法對機器學習演算法進行特徵縮放
- 將資料分為測試集和訓練集
- 建模
- 邏輯迴歸
- 交叉驗證
- ROC曲線和曲線下面積(Area Under Curve,AUC)
- 超參數優化(使用GridSearchCV)
- 決策樹演算法
- 支援向量機演算法
- 隨機森林演算法
- 超參數優化(使用GridSearchCV)
- 結論
- 專案總結與分享
關於機器學習和資料科學的常見問題
什麼是機器學習?
機器學習是指利用基於真實世界資料訓練的模型進行預測的系統。例如,假設我們想要建立一個能夠辨識圖片中是否有貓的系統。首先,我們需要收集大量圖片來訓練機器學習模型。在訓練階段,我們將圖片以及圖片中是否包含貓的資訊輸入模型。訓練過程中,模型會學習與貓咪最密切相關的影像模式。然後,該模型可以利用訓練過程中學習到的模式來預測新輸入的圖片中是否包含貓。在這個例子中,我們可能會使用神經網路來學習這些模式,但機器學習可以比這簡單得多。即使只是將一條直線擬合到一組觀測資料點,並利用這條直線進行新的預測,也算是一種機器學習模型。
機器學習有哪些用途?
如今,機器學習幾乎應用於所有領域。這包括醫療診斷、人臉辨識、天氣預報、影像處理等等。在任何需要進行模式識別、預測和分析的場景下,機器學習都能發揮作用。當應用於新興產業和細分領域時,機器學習往往是一種顛覆性技術。機器學習工程師可以找到新的方法,將機器學習技術應用於最佳化和自動化現有流程。藉助正確的資料,您可以利用機器學習技術識別極為複雜的模式,並得出高度精確的預測結果。
機器學習需要編寫程式碼嗎?
雖然可以在不編寫程式碼的情況下使用機器學習,但建立新系統通常需要程式碼。例如,亞馬遜的 Rekognition 服務可讓您透過網頁瀏覽器上傳圖像,然後識別圖像中的物件。它使用預訓練模型,無需編寫任何程式碼。然而,開發機器學習系統需要編寫一些 Python 程式碼來訓練、調整和部署模型。很難避免編寫程式碼來預處理輸入模型的資料。機器學習從業者的大部分工作都涉及清理用於訓練機器的資料。他們還會進行“特徵工程”,以確定要使用哪些資料以及如何將其準備用於機器學習模型。 AutoML 和 SageMaker 等工具可以自動調整模型。通常只需幾行程式碼即可訓練模型並進行預測。對 Python 的入門了解將使您更有效地使用機器學習系統。
哪種語言最適合機器學習?
Python 是機器學習領域最常用的語言。編寫機器學習系統的工程師通常會將 Jupyter Notebook 和 Python 結合使用。 Jupyter Notebook 是一款 Web 應用程式,可讓使用者建立和分享包含即時程式碼、公式等的文檔,從而進行實驗。機器學習需要反覆試驗,才能找到最佳的超參數和特徵工程方案。擁有像 Python 這樣的開發環境非常有用,這樣您就無需每次運行程式碼前都進行編譯和打包。 Python 並非機器學習的唯一語言選擇。 TensorFlow 是一個受歡迎的神經網路開發框架,並提供 C++ API。還有一個名為 ML.NET 的 C# 機器學習框架。 Scala 或 Java 有時會與 Apache Spark 結合使用,以建立能夠處理大量資料集的機器學習系統。在機器學習中,你可能會用到許多不同的程式語言,但 Python 是個不錯的入門選擇。
機器學習有哪些不同的類型?
機器學習通常分為監督式機器學習和無監督式機器學習。在監督式機器學習中,我們使用已標記的資料來訓練機器學習模型。例如,一個用於偵測垃圾郵件的演算法可能會接收數千個被標記為「垃圾郵件」或「非垃圾郵件」的電子郵件地址。訓練好的模型甚至可以識別從未見過的新垃圾郵件。在無監督式學習中,機器學習模型會在非結構化資料中尋找模式。聚類就是一種無監督式學習。在這個例子中,模型可以透過研究電影的劇本或演員陣容來識別相似的電影,然後將這些電影歸類到不同的類型中。這個無監督式模型並沒有被訓練去知道一部電影屬於哪個類型。相反,它透過研究電影本身的屬性來學習類型。在這兩種機器學習類型中,有許多可用的技術,例如深度學習、強化學習等等。
機器學習是個好的職業選擇嗎?
對資料科學家的需求正在成長。我們不僅需要資料科學家,還需要資料工程師、資料管理員和分析經理。這些工作的薪水通常也很不錯。這或許會讓你思考,這是否是適合你的職涯發展方向。更了解資料科學家的工作內容,可以幫助你判斷這是否是適合你的職涯道路。首先,你必須具備分析思維。資料科學的核心在於透過數據更深入地理解資訊。你是否擅長核實訊息,並樂於鑽研統計資料?雖然實際工作可能相當技術性,但最終的研究成果仍需要傳達給其他人。你能否向沒有技術背景的人解釋複雜的研究結果?許多資料科學家在跨職能團隊中工作,需要與背景迥異的人分享研究成果。如果你覺得這樣的工作環境很棒,那麼這可能是個適合你的職涯發展方向。
透過我的最新課程,你將有機會保持知識更新,並掌握一系列Python程式設計技能。我也很高興地告訴您,我將隨時為您提供學習支援並解答疑問。
您為什麼想參加這門課?
答案很簡單:教學品質。
報名後,您將感受到 OAK Academy 經驗豐富的開發人員的專業指導。
視訊和音訊製作品質
我們所有的影片均採用高品質的視訊和音訊製作,旨在為您提供最佳的學習體驗。
您將獲得:
- 視力清晰
- 聽力清晰
- 全程無幹擾地完成課程
您還將獲得:
- 課程終身訪問權限
- 問答區快速友善的支持
- 可下載的 Udemy 結業證書
- 我們提供全程支持,解答您的任何問題。
如果您準備好學習
立即開始:機器學習專案:心臟病發作預測分析
資料科學與機器學習 – 透過真實的心臟病發作分析專案提升您的機器學習和統計技能
課程中見!
目標受眾
- 任何想要在基於 Web 的資料科學環境中尋找和發布資料集、探索和建立模型、與其他資料科學家和機器學習工程師合作,以及參加資料科學競賽以解決資料科學挑戰的人。
- 想要參加資料科學和機器學習競賽的人
- 想要透過 Kaggle 提升資料科學、機器學習和 Python 履歷的人
- 任何對人工智慧、機器學習、深度學習(簡稱資料科學)感興趣的人
- 任何以資料科學為職業目標的人
- 任何需要一份關於如何開始和發展機器學習職業生涯的完整指南的人
- 對在 Python 環境中進行資料科學應用入門感興趣的學生
- 想要學習如何使用 Python 在真實資料上應用監督式學習(分類)的學生
講師簡介
Oak Academy 人工智慧、CompTIA認證、網路安全、安卓開發和IT課程
截至2025年,全球科技業正經歷重大變革。世界經濟論壇發布的《2025年未來就業報告》預測,到2030年,全球淨增就業將達到7,800萬個,同時將湧現1.7億個新職位,並有9,200萬個職位被取代。這種動態變化凸顯了技能再培訓和提升對於使勞動力與不斷變化的行業需求相匹配至關重要。
OAK 學院的使命
OAK 學院致力於彌合技能差距,提供易於取得、與時俱進且符合產業需求的課程。我們的目標是幫助個人開啟新的職業生涯、轉變職業道路或探索新的興趣和愛好,並讓他們能夠按照自己的步調發展。我們相信,為這一代人提供必要的技能,才能讓他們在科技業獲得理想的職涯發展。
高需求領域的專業課程
我們專注於以下幾個成長迅猛、需求旺盛的關鍵領域:
人工智慧 (AI) 和機器學習:人工智慧相關職位在就業成長名單中名列前茅,我們的課程旨在培養學生開發智慧演算法和模型,從而推動各行業的創新。
網路安全:歐盟網路安全局 (ENISA) 指出,網路威脅日益複雜且頻繁,因此迫切需要具備相關技能的專業人員來保護數位資產。
資料分析與資料科學:隨著資料在決策中扮演越來越重要的角色,我們的課程著重於解讀複雜的資料集,從而為策略性業務選擇提供依據。
雲端運算:鑑於雲端服務的廣泛應用,我們的課程涵蓋雲端解決方案的設計、部署和管理。
軟體和 Web 開發:我們提供創建強大應用程式和響應式網站的培訓,這些技能的需求一直很高。
業界相關且與時俱進的課程
在 OAK Academy,我們融合實用見解和真實案例,確保學生為當前的就業市場做好充分準備。
加入 OAK Academy 社區
無論您是初次探索程式設計的新手,還是希望學習新語言的資深開發者,亦或是正在考慮職業轉型的人士,OAK Academy 都將全力支持您的學習之旅。我們致力於將充滿熱情的人士培養成能夠應對瞬息萬變的科技領域挑戰的專業人士。
如有任何疑問或需要協助,請隨時聯繫我們專業的團隊。
我們是 OAK Academy 的學生支援團隊,負責教學和課程準備。學生的滿意度是我們的首要任務和動力來源。您可以透過此帳號提交技術支援請求,或在購買課程後遇到任何問題,也可以向我們提問。
英文字幕:有
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
- Udemy 永久擁有課程 許多課程約 NT400(點擊連結看更多)
- ✨年訂閱每月 NT350(再享特別優惠:年度訂閱首年享 25% 折扣) 🌈 悠遊 Udemy 的 26000+ 門課,最大化學習 ( 原價 NT635/月 )
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程

也許你會有興趣
- 機器學習的特徵工程
- 中文課程-機器學習 A-Z 課程
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
不受 FB 演算法影響,歡迎透過 e-mail 訂閱網站更新
找其它課程?試看看 Soft & Share 網站搜尋引擎
✍ 搜尋結果太多?可參考 Soft & Share 搜尋引擎使用技巧
你必須登入才能發表留言。