fbpx

GCP 上的資料工程、大數據和機器學習專業課程

Google 雲端平台資料工程。開始你的資料工程職業。通過大數據和機器學習交付商業價值。

你將學到的內容

  • 大規模處理大數據以進行分析和機器學習
  • 建立新機器學習模型的基礎
  • 建立串流數據管道和儀表板

關於此課程

該線上專業知識提供參與者有關在 Google Cloud Platform( GCP )上設計和建構數據管道的動手做學習課。通過簡報、演示和動手實驗的結合,參與者將學習如何設計資料處理系統、建立端到端數據管道、分析資料並獲得見解。該課程涵蓋結構化、非結構化和串流數據。

本課程教授以下技能

  • 在 Google Cloud Platform 上設計和建立數據管道
  • 使用 Cloud Dataproc 將現有的 Hadoop 工作負載提升並轉移到雲中
  • 通過在 Cloud Dataflow 上實施自動擴展數據管道來做批量處理和串流數據
  • 使用 Data Fusion (資料融合)和 Cloud Composer (雲設計家)管理數據管道
  • 使用 Google BigQuery 從龐大的資料集中獲得商業洞見
  • 了解如何用預建構的 ML API 在非結構化的資料上,以及如何使用 BigQuery ML 建構各種 ML 模型
  • 從串流數據中獲得即時見解

本專業課程為負責以下工作的開發人員設計:

  • 提取、載入、轉換、清理和驗證資料
  • 設計用於資料處理的管道和架構
  • 將分析和機器學習功能整合到數據管道中
  • 查詢資料集,可視化查詢結果並創建報告

>>>註冊此專業即表示您同意 FAQ 中列出的 Qwiklabs 服務條款,該條款位於: https://qwiklabs.com/terms_of_service <<<

應用的學習專案

本專業包含使用我們的 Qwiklabs 平台的動手實驗室。

這些動手的組件將讓你將視訊講座中學得的技能做應用。專案將包含如 Google BigQuery 等主題,在 Qwiklabs 內使用和配置。你可以期望通過各個講座中介紹的概念獲得實踐經驗。

到官方網站了解本課程與上課

製作方  

googlecloud.png

Google Cloud 培訓團隊負責開發、交付和評估培訓,使我們的企業客戶和合作夥伴能夠以有效且有影響力的方式使用我們的產品和解決方案產品。

我們幫助數百萬組織支持其員工的工作,提供服務給他們的客戶,並利用雲端建立創新技術為他們的業務建構下一波的創新風潮。 我們的產品以安全性、可靠性和可擴展性做工程化設計,從基礎架構到應用程式、到設備和硬體全端的運作。 我們的團隊致力於幫助客戶應用我們的技術創造成功。

第 1 門課程  Google 雲端平台( GCP )大數據和機器學習基礎

這一為期2週的加速課程將介紹 Google Cloud Platform(GCP)的大數據和機器學習功能。 它提供了 Google 雲端平台的快速概覽以及資料處理功能的更深入介紹。

完成本課程時,你將能夠:

  • 辨識出 Google 雲端平台中關鍵大數據和機器學習產品的目的和價值
  • 使用 CloudSQL 和 Cloud Dataproc 將現有的 MySQL 和 Hadoop / Pig / Spark / Hive工作負載遷移到 Google 雲端平台
  • 使用 BigQuery 和 Cloud Datalab 來執行互動式資料分析
  • 在 Cloud SQL、BigTable 和 Datastore 之間進行選擇
  • 運用 TensorFlow 訓練的神經網路
  • 在 Google 雲端平台上選擇不同的資料處理產品

在參加本課程之前,參加者應具有大致 1 年的以下一項或多項經驗:

  • 常見的查詢語法,如SQL
  • 提取、轉換、載入活動
  • 資料建模
  • 機器學習和/或統計
  • 用 Python 程式設計

Google帳戶說明:

  • 你需要 Google / Gmail 帳戶和信用卡或銀行帳戶才能註冊 Google Cloud Platform 免費試用版(Google服務目前在中國無法使用)。
  • 如果你是具有歐盟(EU)和俄羅斯帳單地址的 Google Cloud Platform 客戶,請讀增值稅概覽( VAT Overview )文件,網址為:https://cloud.google.com/billing/docs/resources/vat-overview
  • 更多 Google 雲端平台免費試用版常見問題解答,請訪問:https://cloud.google.com/free-trial/

第 2 門課程  在 GCP 做資料湖( Data Lakes )和資料倉儲(Data Warehouses )的現代化

任何數據管道的兩個關鍵組件是資料湖和資料倉儲。本課程重點介紹每種存儲類型的用例,並詳細介紹 Google Cloud Platform ( GCP )上可用的資料湖和資料倉儲解決方案。

此外,本課程還描述了資料工程師的角色,成功的數據管道對商業營運的好處,並探討了為什麼應在雲環境中進行資料工程。

學習者將使用 QwikLabs 在 Google Cloud Platform 上獲得有關資料湖和資料倉儲的實踐經驗。


第 3 門課程  在 GCP 建置批量數據管道

數據管道通常屬於 Extra-Load、Extract-Load-Transform 或 Extract-Transform-Load 範式( paradigms )之一。本課程描述應使用哪種範式以及何時使用批量處理數據。

此外,本課程涵蓋 Google Cloud Platform 上用於資料轉換的多種技術,包括 BigQuery、在 Cloud Dataproc 上執行Spark、Cloud Data Fusion 的管道圖,以及使用 Cloud Dataflow 進行無伺服器( serverless )資料處理。

學習者將獲得使用 QwikLabs 在Google Cloud Platform 上建構數據管道組件的動手做經驗。


第 4 門課程  在 GCP 建置彈性串流分析系統

*注意:這是一門新課程,你在本專業課的上一版見過,但有所更新。

隨著串流使企業能夠即時獲取有關業務運營的實時指標,處理串流數據變得越來越受歡迎。本課程介紹如何在 Google Cloud Platform 上建構串流數據管道。描述了用於處理傳入的串流數據的 Cloud Pub / Sub。

該課程還介紹如何使用 Cloud Dataflow 將聚合和轉換應用於串流數據,以及如何將處理後的記錄儲存到 BigQuery 或 Cloud Bigtable 進行分析。

學習者將獲得使用 QwikLabs 在 Google Cloud Platform 上建構串流數據管道組件的動手做經驗。


第 5 門課程   GCP 上做智慧分析、機器學習和 AI

將機器學習整合到數據管道中可以提高企業從資料中提取洞見的能力。本課程涵蓋一些在 GCP 上機器學習可被包含入數據管道的方法,視客製化需求程度而定。

對於很少到完全不需客製化者,本課程引介 AutoML。要獲得較多量身訂做的機器學習功能,本課程介紹 AI 平台筆記本( Platform Notebook ) 和 BigQuery 機器學習( Machine Learning )。

此外,本課程還將介紹如何使用 Kubeflow 將機器學習解決方案進行生產化。

學習者將獲得使用 QwikLabs 在 Google Cloud Platform 上建構機器學習模型的動手做經驗。


 到官方網站了解本課程與上課

你可能會有興趣

 歡迎使用 App / Email | Telegram 訂閱 網站更新

Spread the love

這個網站採用 Akismet 服務減少垃圾留言。進一步瞭解 Akismet 如何處理網站訪客的留言資料

Powered by WordPress.com.

Up ↑

%d 位部落客按了讚: