DuckDB – 終極指南

精通 DuckDB:未來的分析資料庫。掌握 DuckDB Python、Streamlit、CLI 和 Docker 的 7 個實作專案+理論

從這 5 小時的課程,你會學到

  • 架構和實作使用 DuckDB 作為資料庫的分析解決方案
  • 你將學習使 DuckDB 在任何機器上都如此快速的基本原理(理論)
  • 你將學習在 Python 環境中使用 DuckDB(實作)
  • 你將學習從 CLI(命令列)環境使用 DuckDB(練習)
  • 使用 DuckDB 作為 Streamlit Python 分析應用程式的後端資料庫(練習)
  • 將 DuckDB 與 dbt(資料建構工具)結合以簡化分析資料倉儲開發(實務)
  • 你將學習如何在 MotherDuck 中工作:DuckDB 的雲端原生環境 (SaaS)(練習)
  • 你將了解 DuckDB 與其他資料庫的不同之處:分析資料庫(Clickhouse、Redshift、Cassandra)和 OLTP(PostgreSQL、SQLITE)

要求

  • 基本 SQL 很有幫助,但不是必需的(我們將使用提供的指南)
  • 基礎 Python
  • 筆記型電腦或個人電腦

課程說明

我為什麼要學 DuckDB?

  1. 過去 2 年內 1200% 的搜索
    它的受歡迎程度正在迅速增長!
  2. 資料湖和龐大的大數據基礎架構(如 Apache Hadoop 和 Spark)並不是所有資料問題的最佳解決方案 DuckDB 是一個很棒的解決方案,用於運行與 PostgreSQL 非常相似的資料庫,但具有巨大的分析能力,在本地沒有任何麻煩
  3. 100% 免費並支援數十種不同的整合 duckdb Python、duckdb dbt、duckdb Streamlit、duckdb s3 & wasm & Docker + 更多:你幾乎可以用它做任何事情。 此外,您還可以輕鬆進行資料匯出:duckdb csv、duckdb parquet、duckdb json 都是立即共享分析結果的方法! Python 整合就像執行「pip install duckdb」一樣簡單,你就可以開始了! 我們將在其中一個案例中深入探討 duckdb Python 整合。
  4. 使用方便
    你可以設定配置來產生 DuckDB 的記憶體實例,而不是為團隊中的每個開發人員配備 PostgreSQL/Mariadb。 如果你需要從網際網路獲取資料,也沒有問題:Duckdb Httpfs 是我們還將研究的一個套件。
  5. 大數據本地分析
    如果你想在相當大的資料上本地運行列式資料庫,那麼確實沒有其他類似的資料庫。 你可以在本地運行 PySpark,但這會更令人頭疼。 Duckdb Pivot 甚至可以幫助你建立類似電子表格的表格。
  6. SQLite之後易於學習
    這是從 SQLite 向分析領域邁出的一步。 DuckDB 在有限列上執行聚合查詢時表現出色,而 SQLite 在使用篩選器取得一行或多行時表現出色。 在本課程中,我們將比較和對照 duckdb 與 Sqlite 以及 duckdb 與 Clickhouse。
  7. 比 Pandas 快 300% 以上
    Pandas 將所有資料載入到記憶體中並在單一執行緒上運行。 因此,它無法在大於記憶體的資料集上運行,也不會使用所有 CPU 核心。 而 DuckDB 可以操作大於記憶體的資料集。 此外,它可以在所有 CPU 核心之間分配負載。 所有這些都預設使用 SQL 語言!

本課程不僅僅是一個 duckdb 教程:它是一個用於掌握這種快速發展的新技術的打包解決方案。

預期成果

本課程結束後:

  • 你將學習如何建置和實施使用 duck db 作為資料庫的分析解決方案
  • 你將學習使 DuckDB 在任何機器上都如此快速的基本原理(理論)
  • 你將了解 DuckDB 與其他資料庫的不同之處:分析資料庫(Clickhouse、Redshift、Cassandra)和 OLTP(PostgreSQL、SQLite)
  • 你將學習在 Python 環境中使用 DuckDB(實作)
  • 你將學習從 CLI(命令列)環境使用 DuckDB(練習)
  • 使用 DuckDB 作為 Streamlit Python 分析應用程式的後端資料庫(練習)
  • 使用 DuckDB dbt(資料建構工具)組合簡化分析資料倉儲開發(實務)
  • 你將學習如何在 MotherDuck 中工作:鴨子資料庫的雲端原生環境 (SaaS)(練習)。 你可以把它想像成在 CLI 中你可能會錯過的 DuckDB GUI
  • 學習在 Docker 環境中與 DuckDB 互動
  • 了解 DuckDB 如何融入分析服務的微服務架構
  • 使用 Rill:一個由 DuckDB 支援的 BI 即程式碼「最後一哩 ETL」平台,可實現極快的儀表板

裡面有什麼

  • 視訊講座(附互動式註釋)
  • 帶有實踐案例大綱的 PDF
  • 演示資源
  • 用於實踐專案的完全打包的程式碼庫
  • 終身訪問所有未來更新
  • 課程結業證書
  • 30天退款保證

課程不是靜態的! 我收集學生的回饋並努力改進

【課程更新】:

  • 01.2024:+獎勵部分:讓我們建立一個由 DuckDB 支持的推薦微服務
  • 02.2024:+「Rill Data」部分:DuckDB 支援的 BI-as-Code「最後一哩 ETL」平台

使用的數位資產:

  • 圖片來自 freepik,具有 freepik dot com 的免費許可“免費向量漸變動態藍線背景”

目標受眾

  • 想要了解現代本地資料倉儲並更快開發分析解決方案的開發人員和資料工程師
  • 想要提高技能並學習如何使用嵌入式分析資料庫的資料分析師和資料科學家
  • 想要提升資料庫和資料建模技能的資料專業人士和愛好者
  • 想成為資料科學家、BI 分析師、資料工程師或資料分析師的人

講師簡介

Max Migutin 資料、數位與雲端講師 | 10年以上經驗

關於我的主要事實:

  • 我透過機器學習、分析和組織有效的 IT 產品管理幫助大公司改善業務:IBM、肯德基、Booking
  • 我曾在 5 個國家(法國、韓國、哈薩克、俄羅斯,現在是荷蘭)居住過,並遊歷過 43 個國家/地區
  • 我是一級大學教授,教授研究生(碩士)學生「人力資源分析」和「人工智慧產業概述」課程

我的課程是量身定制的,旨在讓您成為該領域的佼佼者。

我以高度的責任感對待我的教練職業。 這就是為什麼我總是在那裡回答您的問題並根據學生的回饋定期更新我的課程!

快樂學習!

字幕:英文

  • 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To

  • Udemy 永久擁有課程 許多課程約 NT400 (點擊連結看更多)
  • 年訂閱每月 NT350 🌈 悠遊 Udemy 的 26000+ 門課,最大化學習 ( 原價 NT635/月 )
  • Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
  • 手機上點選優惠連結看到的價格比電腦上看到的貴
  • $代表當地貨幣, 如在台灣為 NT
  • 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現

報名參加課程

Sponsored by Udemy


也許你會有興趣

不受 FB 演算法影響,歡迎透過 e-mail 訂閱網站更新

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

由 WordPress.com 建置.

Up ↑

探索更多來自 Soft & Share 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading