Contents
成為雲端資料科學專家。使用 Amazon SageMaker 開發資料科學專案並將其擴展到雲端
關於此專業課程
開發環境可能沒有生產環境的確切要求。將資料科學和機器學習專案從構思轉移到生產需要最先進的技能。你需要設計和實施你的專案以提高規模和營運效率。資料科學是一個跨學科領域,將領域知識與數學、統計學、資料視覺化和程式設計技能相結合。
實用資料科學專業使用 AWS 雲端專門建構的 ML 工具將這些學科結合在一起。它可以幫助你培養實用技能,以有效地部署你的資料科學專案,並使用 Amazon SageMaker 克服 ML 工作流程的每個步驟中的挑戰。
本專業專為熟悉 Python 和 SQL 程式語言的以資料為中心的開發人員、科學家和分析師而設計,他們希望學習如何建構、訓練和部署可擴展的端到端 ML 管道 – 包括自動化和 huaman-in-the-loop ( 人在迴路 )- 在 AWS 雲端。
每 10 週都有一個專門為此專業開發的綜合實驗室,提供有關自然語言處理 (NLP) 和自然語言理解 (NLU) 的最先進算法的實踐經驗,包括使用 Amazon SageMaker 的 BERT 和 FastText。
到官方網站了解本課程與上課
- Machine Learning:機器學習
- ML Models :機器學習模型
- MLOps:機器學習系統的營運 Machine learning + DevOps
應用的學習專案
在本專業化結束時,你將準備好:
- 攝取、註冊和探索資料集
- 檢測資料集中的統計偏差
- 使用 AutoML 自動訓練和選擇模型
- 從原始資料創建機器學習功能
- 在特徵儲存中保存和管理特徵
- 使用內置算法和自定義 BERT 模型訓練和評估模型
- 除錯、分析和比較模型以提高性能
- 建構並運行完整的端到端機器學習管道
- 使用超參數調整優化模型性能
- 部署和監控模型
- 大規模執行資料標籤
- 建構 human-in-the-loop 管道以提高模型性能
- 降低成本並提高資料產品的性能
你將學到的內容有
- 準備資料、檢測統計資料偏差、大規模執行特徵工程以訓練模型,以及使用 AutoML 訓練、評估和調整模型
- 使用特徵儲存保存和管理 ML 特徵,並在追蹤資料沿襲和模型工件的同時除錯、分析、調整和評估模型
- 構建、部署、監控和操作端到端機器學習管道
- 建構資料標籤和 human-in-the-loop (人在迴路 ) 管道,以利用人類智慧提高模型性能
你將獲得的技能:
用 BERT 做自然語言處理 | ML 管道和 ML 操作( NKOps ) | A/B 測試和模型部署 |
大規模做資料標籤 |
字幕
英文
製作方
DeepLearning.AI 是一家開發全球人工智慧人才社區的教育技術公司。 DeepLearning.AI 以專家為主導的教育體驗為 AI 從業者和非技術專業人士提供了從基礎到高級應用的必要工具,使他們能夠構建 AI 驅動的未來。
自 2006 年以來,Amazon Web Services 一直是世界上最全面、應用最廣泛的雲平台。 AWS 提供超過 90 項功能齊全的服務,用於計算、儲存、網路、資料庫、分析、應用程式服務、部署、管理、開發人員、行動、物聯網 (IoT)、人工智慧、安全、混合和企業應用程式,來自 44 個可用區跨越 16 個地理區域。 AWS 服務受到全球數百萬活躍客戶的信賴——包括增長最快的新創公司、最大的企業和領先的政府機構——為他們的基礎設施提供支持、使其更加敏捷並降低成本。 Coursera 和 AWS 自 2017 年以來一直是合作夥伴,為全球的學習者和企業提供成功所需的技能。 Coursera 建立在 AWS 伺服器之上,可以根據學生的需求進行擴展,並且對容量和彈性充滿信心,並與 AWS 合作。 2019 年,Coursera 獲得了高級級別合作夥伴身份,並進一步擴展了與 AWS Educate、AWS EdStart 和 AWS Academy 的合作夥伴關係。 Coursera 已經能夠通過 Coursera 平台上的 8 門 AWS 課程讓雲端技能更容易獲得,這些課程由頂級主題專家組成,並且產品組合繼續增長。要了解有關 AWS 的更多資訊,請訪問 https://aws.amazon.com。
第 1 門課程 使用 AutoML 分析資料集和訓練 ML 模型
在實用資料科學專業的第一門課程中,您將學習探索性數據分析 (EDA)、自動化機器學習 (AutoML) 和文本分類算法的基本概念。使用 Amazon SageMaker Clarify 和 Amazon SageMaker Data Wrangler,你將分析數資料的統計偏差,將資料集轉換為機器可讀的特徵,並選擇最重要的特徵來訓練多類文本分類器。然後,你將執行自動化機器學習 (AutoML),以使用 Amazon SageMaker Autopilot 為給定資料集自動訓練、調整和部署最佳文本分類演算法。接下來,你將使用 Amazon SageMaker BlazingText(一種流行的 FastText 演算法的高度優化和可擴展的實現),用很少的程式碼訓練一個文本分類器。
實用資料科學旨在處理不適合本地硬體並且可能來自多個來源的海量資料集。在雲端開發和運行資料科學專案的最大好處之一是雲提供的敏捷性和彈性,可以以最低成本向上和向外擴展。
實用資料科學專業課程可幫助你培養實用技能,以有效部署你的資料科學,並使用 Amazon SageMaker 克服 ML 工作流程每個步驟中的挑戰。本專業專為熟悉 Python 和 SQL 編程語言並希望了解如何建構、訓練和部署可擴展的端到端 ML 管道(包括自動化和人工參與)的以資料為中心的開發人員、科學家和分析師而設計 human-in-the-loop – 在 AWS 雲端。
第 2 門課程 使用 BERT 建構、訓練和部署 ML 管道
在實用資料科學專業的第二門課程中,你將通過使用 Hugging Face 對最先進的 BERT 演算法以 Amazon SageMaker 管道高度優化實現來建構端到端機器學習管道,學習自動化自然語言處理任務。你的管道將首先將資料轉換為 BERT 可讀的特徵,並將這些特徵儲存在 Amazon SageMaker Feature Store 中。然後,它將使用 Hugging Face 預訓練模型將文本分類模型微調到資料集,該模型已經學會從數百萬維基百科文檔中理解人類語言。最後,你的管道將評估模型的準確性,並且僅在準確性超過給定閾值時才部署模型。
實用資料科學旨在處理不適合本地硬體並且可能來自多個來源的海量資料集。在雲端開發和運行資料科學專案的最大好處之一是雲提供的敏捷性和彈性,可以以最低成本向上和向外擴展。
實用資料科學專業可幫助你培養實用技能,以有效部署你的資料科學專案,並使用 Amazon SageMaker 克服 ML 工作流程每個步驟中的挑戰。本專業專為熟悉 Python 和 SQL 程式語言並希望了解如何建構、訓練和部署可擴展的端到端 ML 管道(包括自動化和人工參與)的以資料為中心的開發人員、科學家和分析師而設計 human-in-the-loop – 在 AWS 雲端。
第 3 門課程 優化 ML 模型並部署 Human-in-the-Loop 管道
在實用資料科學專業的第三門課程中,你將學習一系列性能改進和降低成本的技術,以自動調整模型精度、比較預測性能,並使用人類智慧生成新的訓練資料。使用 Amazon SageMaker 超參數調整 (HPT) 調整文本分類器後,你將部署兩個候選模型到 A/B 測試中以比較它們的實時預測性能,並使用 Amazon SageMaker 託管自動擴展獲勝模型。最後,你將使用 Amazon Augmented AI 和 Amazon SageMaker Ground Truth 設置人機交互管道來修復錯誤分類的預測並生成新的訓練資料。
實用資料科學旨在處理不適合本地硬體並且可能來自多個來源的海量資料集。在雲端開發和運行資料科學專案的最大好處之一是雲提供的敏捷性和彈性,可以以最低成本向上和向外擴展。
實用資料科學專業可幫助你培養實用技能,以有效部署你的資料科學專案,並使用 Amazon SageMaker 克服 ML 工作流程每個步驟中的挑戰。本專業專為熟悉 Python 和 SQL 程式語言並希望了解如何建構、訓練和部署可擴展的端到端 ML 管道(包括自動化和人工參與)的以資料為中心的開發人員、科學家和分析師而設計 human-in-the-loop – 在 AWS 雲端。
到官方網站了解本課程與上課

也許你會有興趣
- AWS 相關線上課程
- ★想要加強英文能力嗎?– 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入
發表迴響