使用 R 進行資料科學:tidyverse

R 程式語言、資料分析、資料清理、資料科學、資料整理、tidyverse、dplyr、ggplot2、RStudio

從這 31 小時的課程,你會學到

  • 如何在資料科學專案中使用 R 的 tidyverse 函式庫
  • 如何為資料科學相關任務編寫高效的 R 程式碼
  • 什麼是乾淨資料
  • 如何使用 R 清理資料
  • 資料整理的語法是什麼
  • 如何使用 dplyr 和 tidyr 處理資料
  • 如何將資料導入R
  • 如何正確解析導入的資料
  • 如何將 R 的函數連結到管道中
  • 如何操作字串
  • 什麼是正規表示式( Regular Expressions )
  • 如何將 stringr library 與正規表示式一起使用
  • 如何使用 forcats library 來操作分類變數
  • 什麼是圖形語法( Grammar of Graphics )
  • 如何使用 ggplot2 library 視覺化資料
  • 什麼是函數式程式設計(  functional programing )
  • 如何使用 purrr library進行映射函數、巢狀資料、操作列表等。
  • 什麼是關聯資料
  • 如何使用 dplyr library 處理關聯資料
  • 什麼是整齊評價( tidy evaluation )
  • 如何使用 tidyverse工具完成一個實際專案

要求

  • R 和 RStudio 已安裝在您的電腦上。
  • 有統計學基礎知識者優先。
  • 具基礎到中級 R 知識者優先。
  • 完全 R 初學者會發現課程更具挑戰性。
  • 對於完全的 R 初學者,我建議首先參加 R 初學者課程之一。
  • 對資料科學和資料科學相關任務感興趣。
  • 對如何編寫高效的 R 程式碼感興趣。
  • 如有必要,請更新 R 或 R 的程式庫( libraries )。 課程教材開頭和結尾處提供的版本清單( R 和練習中使用的所有 R libraries )。

課程說明

資料科學技能仍然是當今就業市場上最受歡迎的技能之一。 許多人只看到資料科學有趣的部分,諸如「搜尋資料洞察」、「揭示資料背後隱藏的真相」、「建立預測模型」、「應用機器學習演算法」等任務。 大多數資料科學家都知道,現實是,當處理真實資料時,任何資料科學專案中最耗時的操作是:「資料導入」、「資料清理」、「資料整理」、「資料探索」等。 因此,有必要有一個足夠的工具來解決給定的資料相關任務。 如果我說,有一個可免費存取的工具,屬於上面提供的描述!

在應用統計、資料科學、資料探索等方面,R 是最受歡迎的程式語言之一。如果將 R 與R 的名為 tidyverse 的庫集合( collection of libraries )結合起來,您將獲得最致命的工具之一,該工具專為資料科學相關的任務。 所有 tidyverse libraries 都共享獨特的哲學、語法和資料類型。 因此,程式庫可以並行使用,使您能夠編寫高效且更優化的 R 程式碼,這將幫助您更快地完成專案。

本課程包括幾個章節,每章介紹與資料相關的任務的不同方面,並使用適當的 tidyverse 工具來幫助您處理給定的任務。 此外,課程還介紹了與主題相關的表格理論以及 R 中涵蓋的實際範例。如果您深入學習課程,您將面臨許多不同的資料科學挑戰,以下只是其中的一些挑戰課程:

  • 整潔資料,如何使用 tidyverse 清理資料?
  • 資料角力( data wrangling )的語法。
  • 如何使用 dplyr 和 tidyr 處理資料。
  • 建立名為 tibble 的類似表格的物件。
  • 使用 readr 和其他程式庫匯入和解析資料。
  • 使用 stringr 在 R 中處理字串。
  • 處理字串時應用正規表示式概念。
  • 使用 forcat 處理分類變數。
  • 資料視覺化語法。
  • 使用 ggplot2 探索資料並繪製統計圖。
  • 使用函數式程式設計的概念,並使用 purrr 映射函數。
  • 在 purrr 的幫助下高效處理清單。
  • 關聯資料的實際應用。
  • 使用 dplyr 來取得關聯資料。
  • tidyverse 內的整潔評估( tidy evaluation )。
  • 將 tidyverse 工具應用於最終的實際資料科學專案。

課程包括:

  • 超過25小時的講座視頻,
  • R 腳本和附加資料(課程材料中提供),
  • 參與每章末尾的作業,
  • 作業演練影片(您可以在其中檢查結果)。

總而言之,這成為 Udemy 使用 R 和 tidyverse 進行資料科學相關任務的最全面的課程之一。

立即註冊並成為 R 的 tidyverse 大師!!!

目標受眾

  • 任何對資料科學感興趣的人
  • 任何對資料分析有興趣的人
  • 任何有興趣編寫高效 R 程式碼的人
  • 任何工作、研究或嗜好與資料清理或資料視覺化相關的人
  • 有抱負的資料科學家、統計學家或資料(業務)分析師
  • 任何處理資料建模並且通常在資料準備/清理步驟上遇到困難的人
  • 學生使用資料

講師簡介

Marko Intihar PhD 資料科學家、教育家和課程創建者

您好,我是 Marko Intihar。我擁有馬裡博爾大學物流學博士學位,並在那裡開啟了我的職業生涯,擔任研究員和助教,專注於統計學、數據分析和運籌學。在學術期間,我還發表了多篇關於時間序列建模的科學論文。

出於對理論實踐的好奇,我進入了行業,首先在零售業工作,擔任一家大型零售公司的資料科學家。這段經歷讓我有機會將機器學習和資料探勘技術應用於真實的大規模資料集。

六年來,我一直在銀行業擔任資料科學家,先後就職於兩家大型銀行。金融數據帶來了獨特的挑戰和機遇,而這種環境也加深了我在預測建模、高階數據分析和商業智慧等領域的技能。

將這一切連結在一起的是我對教學的熱情。我創建課程,幫助學習者掌握現代資料科學的工具、技術和概念。無論您是在學習統計學、探索機器學習,還是使用 R 或 Python 等工具深入資料分析,我的目標都是讓複雜的主題變得易於理解和應用。

如果您渴望在資料科學領域打下堅實的基礎,並將其應用於實際問題,那麼您來對地方了。

“讓我們攜手,將真實數據轉化為深刻洞見,為世界賦予更多意義。”

字幕:英文

  • 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To

  • Udemy 永久擁有課程 許多課程約 NT400 (點擊連結看更多)
  • 年訂閱每月 NT350 🌈 悠遊 Udemy 的 26000+ 門課,最大化學習 ( 原價 NT635/月 )
  • Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
  • 手機上點選優惠連結看到的價格比電腦上看到的貴
  • $代表當地貨幣, 如在台灣為 NT
  • 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現

報名參加課程

Sponsored by Udemy


也許你會有興趣

不受 FB 演算法影響,歡迎透過 e-mail 訂閱網站更新

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

由 WordPress.com 建置.

Up ↑

探索更多來自 Soft & Share 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading