深入研究 DuckDB 並開始輕鬆處理千兆位元組的資料 – 所有這些都不需要資料倉儲。
MEAP 於 2023 年 10 月開始 2024 年夏季出版(預計)
每當你想要分析大數據集時,你不需要昂貴的硬體或啟動全新的叢集。 你只需要 DuckDB! 這種現代且快速的嵌入式資料庫在筆記型電腦上運行,讓你可以輕鬆處理幾乎任何來源的數據,包括 JSON、CSV、Parquet、SQLite 和 Postgres。 在 DuckDB in Action 中,你將學到充分利用這個出色工具所需的一切知識,確保你的資料在本地安全,並為你節省數百美元的雲端費用。
打開 DuckDB in Action 並了解如何:
- 從本地和遠端的 CSV、JSON 和 Parquet 來源讀取和處理資料
- 編寫分析 SQL 查詢,包括聚合、公用表表達式、視窗函數、特殊類型的連接和資料透視表
- 使用 Python 中的 DuckDB,同時使用 SQL 及其「關係型」API,與資料庫以及資料框架進行互動
- 準備、擷取和查詢大型資料集
- 建構雲端資料管道
- 使用自訂功能擴充 DuckDB
DuckDB in Action 介紹了 DuckDB 資料庫,並向你展示如何使用它來解決常見的資料工作流程問題。 它充滿了速效成果 – 從第一章開始,你就會發現 DuckDB 可以加快你作為資料專業人員的工作的新方法。 每個新概念都配有一個實作專案範例,因此你可以輕鬆了解 DuckDB 的實際工作原理。
關於這本書
DuckDB in Action 將向你展示如何快速上手使用 DuckDB。 你無需閱讀一頁又一頁的文件 – 你將在工作中學習。 從 DuckDB 的 CLI 嵌入模式開始,然後直接深入了解現代 SQL 查詢並利用 DuckDB 方便的 SQL 擴充。 從那裡,你將探索使用 DuckDB 分析資料的不同方法,包括進階聚合和分析、無持久性的資料以及 DuckDB 的底層架構。 了解如何將 DuckDB 與 Python 生態系統結合以實現更大程度的定制,以及如何使用 DuckDB 自己的工具來擴展 DuckDB。 你將像如魚得水一樣使用 DuckDB,以零摩擦快速解決幾乎所有關聯式資料任務。
內容包含


目標讀者
適合對分析結構化資料感興趣的資料科學家、資料工程師和開發人員。你需要了解一些 Python、CLI 工具和 SQL 知識才能充分利用本指南。
關於作者
Mark Needham 是 @LearnDataWithMark 的部落客和影片創作者,他的 DuckDB 系列為觀眾提供了對實際資料庫應用程式的實踐見解。
Michael Hunger 致力於開發開源 Neo4j 圖形資料庫,擔任許多角色,領導產品創新和開發人員產品策略。
Michael Simons 是一位 Java 冠軍、作家和 Neo4j 的資深軟體工程師,作為開發人員已經從事專業工作 20 多年。
關於 MEAP 搶鮮電子書
一本書可能需要一年或更長的時間才能寫出來,那麼你今天如何學習熱門新技術? 答案是MEAP,即 Manning Early Access 計劃。 在 MEAP 中,你可以逐次閱讀章節方式閱讀一本書當書還在進行撰寫中,一旦完成,即可獲得最終的電子書。 如果您預訂 pBook,你可以在上架到商店之前用很久。
更詳細的 MEAP 請參考 MEAP 說明
購買書籍網址 | 今日特價書

也許你會有興趣
- 資料庫線上課程與電子書
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入

發表迴響