資料科學的 SQL 基礎專業課程

透過四個漸進難度的 SQL 專案和資料科學應用程式,你將學會 SQL 基礎知識、資料整理、SQL 分析、AB 測試、使用 Apache Spark 的分散式運算、Delta Lake 等主題。

關於此專業課程

此專業課針對沒有任何程式經驗、尋求提高 SQL 查詢流暢性的學習者製作。 透過四個漸進難度的 SQL 專案和資料科學應用程式,你將學會 SQL 基礎知識、資料整理、SQL 分析、AB 測試、使用 Apache Spark 的分散式運算、Delta Lake 等主題。 這些主題將幫助你創造性地應用 SQL 來分析和探索資料; 展現編寫查詢的效率; 建立資料分析資料集; 進行特徵工程,將 SQL 與其他資料分析和機器學習工具集結合使用; 並對非結構化資料集使用 SQL。

到官方網站了解本課程與上課

你將學到的內容有

  • 使用SQL指令過濾、排序和匯總資料; 操作來自不同來源的字串、日期和數字資料以進行分析
  • 使用 SQL 評估和建立資料集來解決你的業務問題
  • 使用協作 Databricks 工作區並建立一個端對端管道來讀取資料、轉換資料並保存結果
  • 制定專案提案並選擇資料,執行統計分析並建立指標,並展示你的發現並提出建議

你將獲得的技能:

資料分析SQLApache Spark
Delta Lake

字幕

英文

製作方

University of California, Davis 加州大學戴維斯分校

加州大學戴維斯分校是美國頂尖的研究型大學之一,在農業、獸醫學、永續發展、環境和生物科學以及技術領域處於全球領先地位。 加州大學戴維斯分校擁有四所學院和六所專業學院,其學生和校友以其卓越的學術成就、有意義的公共服務和深遠的國際影響力而聞名。

第 1 門課程   用於資料科學的 SQL

在本課程中,你將學到:

  • 一列或一組列所需的資料子集,並編寫 SQL 查詢來限制這些結果。
  • 使用 SQL 指令來過濾、排序和匯總資料。
  • 使用 UNION 運算子從多個查詢建立分析表。
  • 使用函數操作字串、日期和數字資料,將來自不同來源的資料整合到具有正確格式的欄位中以進行分析。

你將獲得的技能:

資料科學資料分析Sqlite
SQL

第 2 門課程 使用 SQL 進行資料整理、分析和 AB 測試

在本課程中,你將學到:

  • 驗證和清理資料集
  • 評估並建立資料集來回答你的問題
  • 使用 SQL 解決問題
  • 建立一個簡單的測試框架來接觸 AB 測試

你將獲得的技能:

請求參數預測分析資料分析
SQLAB 測試

第 3 門課程  使用 Spark SQL 進行分散式運算

在本課程中,你將學到:

  • 使用協作 Databricks 工作區編寫針對電腦叢集執行的可擴充 Spark SQL 程式碼
  • 檢查 Spark UI 以分析查詢效能並識別瓶頸
  • 建立一個端到端管道來讀取資料、轉換資料並保存結果
  • 使用 Delta Lake 建立獎章(銅牌、銀牌、金牌)Lakehouse 架構,以確保資料的可靠性、可擴展性和性能

你將獲得的技能:

資料科學SQLApache Spark
Delta Lake

第 4 門課程  SQL 資料科學總整專案

在本課程中,你將學到:

  • 制定專案提案並選擇你的資料
  • 執行描述性統計作為探索性分析的一部分
  • 在 SQL 中開發指標並執行高級技術
  • 展示你的發現並提出建議

你將獲得的技能:

資料分析創建指標演講技巧
SQL探索性資料分析

到官方網站了解本課程與上課

Sponsored by Coursera


你可能會有興趣

不受 FB 演算法影響,歡迎透過 e-mail 訂閱網站更新

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

由 WordPress.com 建置.

Up ↑

探索更多來自 Soft & Share 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading