fbpx

IBM 資料倉庫工程師專業證書

開啟你的 BI 工程職業生涯。為資料倉庫中的入門級角色培養工作準備技能。 4.7⭐️

關於此專業課程

該專業證書旨在幫助你培養入門級商業智慧 (BI) 或資料倉庫工程職位的工作準備技能和投資組合。在該計劃的線上課程中,你將沉浸在資料倉庫工程師的需求角色中,並獲得使用一系列工具和資料庫來設計、部署、操作和管理企業資料倉庫所需的基本技能(EDW)。

在此專業證書結束時,你將能夠執行資料倉庫工程角色所需的關鍵任務。你將使用關聯資料庫管理系統 (RDBMS) 並使用 SQL 語句查詢資料。

你將使用 Linux/UNIX shell 腳本自動執行重複性任務,並使用 Apache Airflow 和 Kafka 等工具構建資料管道以提取、轉換和載入 (ETL) 資料。你將獲得管理資料庫和資料倉庫的經驗。

最後,你將設計和填充資料倉庫系統,並利用商業智慧工具通過報告和儀表板分析和提取見解。

該計劃適合任何對學習充滿熱情的人,無論你是否擁有大學學位,並且不需要任何資料工程或程式經驗,都適合參加。

到官方網站了解本課程與上課

應用的學習專案

每門課程都包括大量動手實驗室和一個專案,用於磨練和應用你所學的概念和技能。在課程結束時,你將設計、實施、配置、查詢和維護大量資料庫,並使用真實世界的工具和資料儲存庫創建資料管道,建立工作準備技能的組合。

你將從在雲端配置資料庫實例開始。接下來,使用實體關係圖 (ERD) 設計資料庫,並使用 MySQL、PostgreSQL 和 IBM Db2 創建表( tables )和鍵( keys )等資料庫物件。

然後,你將熟練使用 SELECT、INSERT、UPDATE 和 DELETE 語句使用 SQL 查詢資料庫,並學習過濾、排序和聚合結果集。接下來,你將熟悉常見的 Linux/Unix shell 命令並使用它們來構建 Bash 腳本。

你將使用 Apache Airflow 和 Kafka 為批量處理和串流的 ETL 作業創建資料管道。最後,實施資料倉庫並創建 BI 儀表板。

你將學到的內容有

  • 編寫和執行各種類型的 SQL 語句和查詢以訪問和操作資料庫中的數據
  • 部署、管理、保護、操作、監控和優化關係資料庫系統,如 MySQL、PostgreSQL 和 DB2
  • 創建資料管道以使用 shell 腳本和 Apache Airflow 和 Kafka 等工具提取、轉換和載入資料儲存庫
  • 使用 Cognos Analytics 等商業智慧 (BI) 工具設計和填充資料倉庫並分析其數據

你將獲得的技能:

關聯資料庫(RDBMS)商業智慧(Business Intelligence, BI)企業資料倉庫(Enterprise Data Warehouse, EDW )
SQL提取變換負載(Extract Transform Load, ETL)資料科學
資料庫(Database, DBMS)NoSQL資料庫設計
資料庫架構PostgresqlMySQL

字幕

英文

製作方

IBM

通過開放式混合雲平台和AI,IBM 是業務轉型的全球領導者,為全球 170 多個國家/地區的客戶提供服務。 如今,《財富》 50強公司中有 47 家依靠 IBM Cloud 來運營業務,而 IBM Watson 企業 AI 則在 30,000 多個專案中努力工作。 IBM 也是世界上最重要的企業研究組織之一,連續 28 年處於專利領導地位。 最重要的是,在信任和透明性原則以及對更具包容性的社會的支持的指導下,IBM 致力於成為負責任的技術創新者和造福世界的力量。

課程 1    資料工程導論

本課程向您介紹為了獲得數據工程的基礎知識而需要了解的核心概念、流程和工具。你將了解現代數據生態系統以及資料工程師、資料科學家和資料分析師在該生態系統中所扮演的角色。

資料工程生態系統包括幾個不同的組件。它包括不同的資料類型、格式和資料源。資料管道從多個來源收集數據,將其轉換為分析就緒資料,並提供給資料消費者進行分析和決策。資料儲存庫,例如關聯和非關聯資料庫、資料倉庫、資料集市、資料湖和大數據儲存處理和存儲這些數據。資料整合平台將不同的資料組合到資料消費者的統一視圖中。你將在本課程中了解這些組件中的每一個。你還將了解大數據和一些大數據處理工具的使用。

典型的資料工程生命週期包括構建資料平台、設計資料儲存以及收集、導入、整理、查詢和分析數據。它還包括性能監控和微調,以確保系統以最佳水平運行。在本課程中,你將了解資料工程生命週期。你還將了解安全性、治理和合規性。

資料工程被公認為當今發展最快的領域之一。課程中討論了該領域可用的職業機會以及進入該領域可以採取的不同途徑。

該課程還包括指導你創建 IBM Cloud Lite 帳戶、供應資料庫實例、將資料載入到資料庫實例中以及執行一些有助於你了解資料集的基本查詢操作的動手實驗。


課程 2  關聯資料庫 (RDBMS) 簡介

你準備好進入資料工程的世界了嗎?你需要深入了解資料的儲存、處理和訪問方式。你需要確定適合你正在使用的資料類型以及資料處理要求的不同類型的資料庫。

在本課程中,你將學習關聯資料庫和關聯資料庫管理系統 (RDBMS) 背後的基本概念。你將研究關聯資料模型並了解它們是如何創建的,它們帶來了什麼好處,以及如何將它們應用到你自己的資料中。你將了解幾個行業標準的關聯資料庫,包括 IBM DB2、MySQL 和 PostgreSQL。

本課程包含動手實踐練習,以幫助你展示所學。你將使用真實資料庫並探索真實世界的資料集。你將創建資料庫實例並用表( tables )填充它們。

不需要資料庫或程式方面的先驗知識。

任何人都可以免費旁聽本課程。如果你選擇參加本課程並獲得 Coursera 課程證書,你還可以在成功完成課程後獲得 IBM 數位徽章。


課程 3   使用 Python 進行資料科學的資料庫和 SQL

世界上的大部分資料都儲存在資料庫中。 SQL(或結構化查詢語言)是一種強大的語言,用於與資料庫進行通訊和從資料庫中提取數據。如果你想成為一名資料科學家,則必須具備資料庫和 SQL 的工作知識。

本課程的目的是介紹關聯資料庫概念,幫助你學習和應用 SQL 語言的基礎知識。它還旨在幫助你開始在資料科學環境中執行 SQL 訪問。

本課程的重點是動手和實踐學習。因此,你將使用真實的資料庫、真實的資料科學工具和真實世界的資料集。你將在雲端創建一個資料庫實例。通過一系列動手實驗,你將練習構建和運行 SQL 查詢。你還將學習如何使用 SQL 和 Python 從 Jupyter 筆記本訪問資料庫。

不需要資料庫、SQL、Python 或程式方面的先驗知識。

任何人都可以免費旁聽本課程。如果你選擇參加本課程並獲得 Coursera 課程證書,你還可以在成功完成課程後獲得 IBM 數位徽章。

限時優惠:訂閱只需每月 39 美元即可訪問分級材料和證書。


課程 4   Linux 命令和 Shell 腳本的實踐介紹

本課程對 Linux 和常用的 Linux/UNIX shell 命令進行了實用的介紹。它教你使用 Bash shell 腳本自動執行各種任務的基礎知識。該課程包括基於視訊的講座以及動手實驗室來練習和應用你所學的知識。你將可以免費訪問可以通過 Web 瀏覽器訪問的虛擬 Linux 伺服器,因此你無需下載和安裝任何東西來執行實驗。

你將學習如何與 Linux 終端交互、執行命令、導航目錄、編輯檔案以及安裝和更新軟體。

你將使用 id、date、uname、ps、top、echo、man 等通用命令; pwd、cd、mkdir、rmdir、find、df等目錄管理命令;檔案管理命令,如 cat、wget、more、head、tail、cp、mv、touch、tar、zip、unzip;訪問控制命令 chmod;文本處理命令 – wc、grep、tr;以及網路命令 – 主機名、ping、ifconfig 和 curl。

你將創建從簡單到更高級的 shell 腳本,包括元字符( Metacharacter )、引用( Quoting )、變量( Variables )、命令替換、I/O 重定向、管道和過濾器以及命令行參數。你還將使用 crontab 安排 cron 作業。

本課程非常適合希望熟悉 Linux、MacOS 和其他類 Unix 操作系統上常用命令並開始創建 shell 腳本的資料工程師、資料科學家、軟體開發人員和雲端從業者。


課程 5  關聯資料庫管理 ( Rational Database Administration, RDBA)

持續的主動管理對於資料庫管理系統的安全性和性能至關重要。

資料庫管理是管理和維護資料庫系統的操作方面的功能。資料庫管理員致力於確保應用程式最有效地利用資料庫,並確保充分有效地使用物理資源。

在本課程中,你將發現管理資料庫的一些活動、技術和最佳實踐。你將了解配置和升級資料庫伺服器軟體和相關產品。你還將了解資料庫安全性;如何實現用戶身份驗證、分配角色和分配物件級權限。你還將了解如何在系統出現故障時執行備份和恢復過程。

你將了解如何優化資料庫的性能、監控資料庫、收集診斷資料以及訪問錯誤資訊以幫助你解決可能出現的問題。其中許多任務是重複性的,因此你將學習如何安排維護活動和定期診斷測試以及發送任務成功或失敗的自動訊息。


課程 6   使用 Shell、Airflow 和 Kafka 的 ETL 和資料管道

完成本課程後,你將能夠描述將原始數據轉換為分析就緒數據的兩種不同方法。一種方法是提取、轉換、載入 (ETL) 過程。另一種對比方法是提取、載入和轉換 (ELT) 過程。 ETL 流程適用於資料倉庫和資料集市。 ELT 流程適用於資料湖,其中資料由請求/呼叫應用程式按需轉換。

ETL 和 ELT 都從源系統中提取資料,通過資料管道移動數據,並將資料儲存在目標系統中。在本課程中,你將體驗 ELT 和 ETL 處理的不同之處,並確定兩者的用例。

你將確定用於提取資料、以邏輯或物理方式合併提取的資料以及將資料導入資料儲存庫的方法和工具。你還將定義要應用於源資料的轉換,以使資料可信、符合上下文並可供資料用戶訪問。你將能夠概述將資料載入目標系統、驗證資料品質、監控加載故障以及在發生故障時使用恢復機制的多種方法中的一些方法。

最後,你將完成一個可共享的期末專案,使你能夠展示你在每個模組獲得的技能。


課程 7   開始使用數據倉庫和 BI 分析

資料是組織最有價值的商品之一。但是組織如何才能最好地使用他們的資料呢?組織如何確定哪些資料是最新、準確且對最高級別的業務決策有用的?

學習完本課程後,你將能夠描述不同類型的儲存庫,包括資料集市、資料湖和資料儲存庫,並解釋它們的功能和用途。

資料倉庫是一個大型資料儲存庫,已清理到一致的品質。在選擇要儲存的資料時,並非所有資料儲存庫都以相同的方式使用或要求相同的嚴格性。資料倉庫旨在通過準確靈活的報告和資料分析來實現快速的業務決策。資料倉庫是當今使用的最基本的商業智慧工具之一,也是成功的資料工程師必須了解的工具。

你還將能夠描述資料倉庫如何為組織的當前和歷史資料提供單一資料真實來源。

組織使用分析和商業智慧應用程式創造資料價值。現在你已經體驗了 ELT 流程,使用 IBM Cognos 及其報告、儀表板功能(包括視覺化功能)獲得動手分析和商業智慧( BI )體驗。

最後,你將完成一個可共享的期末專案,使你能夠展示你在每個模組中獲得的技能。

到官方網站了解本課程與上課


Sponsored by Coursera

追蹤 Soft & Share

✍ 不受社群推薦演算法影響,建議 Telegram/Discord/e-mail


幫我們個小忙!

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

Powered by WordPress.com.

Up ↑

%d 位部落客按了讚: