Contents
關於此專業證書
此六門課程的專業知識旨在為你準備參加 IBM AI Enterprise Workflow ( 企業工作流程 ) V1 資料科學專家的認證考試。 IBM AI Enterprise Workflow 是一個全面的端到端流程,使資料科學家能夠建構 AI 解決方案,開始於業務的優先順序,一直到將 AI 投入生產。
該學習旨在提升執業資料科學家的技能,經由明確的業務優先順序連結技術實施,連結機器學習到特定的 AI 用例( 例如視覺識別和 NLP ),以及 Python 連接到 IBM 運端的技術。
這些課程中的影片、閱讀材料和案例研究旨在指導你完成一個假設的串流媒體公司的資料科學家工作。
在整個專業課程中,重點將放在大型現代企業中的資料科學實踐上。將指導你使用IBM 雲端上的企業級工具,這些工具將用於創建、部署和測試機器學習模型。你最喜歡的開源工具(如 Jupyter 筆記本和 Python 程式庫)將廣泛用於準備資料和構建模型。將使用與開源工具無縫協作的 IBM Watson 工具將模型部署在 IBM Cloud 上。成功完成此專業課之後,你將準備好參加 IBM AI Enterprise Workflow 的正式 IBM 認證考試。
你將獲得的技能:
資料科學 | 資訊工程 | 人工智慧 ( AI ) |
機器學習 | Python 程式設計 |
字幕
英文
到官方網站了解本課程與上課
製作方

IBM 提供廣泛的技術和諮詢服務;廣泛的中介軟體產品組合,用於協作、預測分析、軟體開發和系統管理;和世界上最先進的伺服器和超級計算機。利用其業務諮詢、技術和研發專業知識,隨著地球變得更加數位化,IBM 幫助客戶變得“更加智慧”。 IBM 每年在研發方面投入超過 60 億美元,剛剛完成其 21 年的專利領導。 IBM Research 已獲得超越任何商業技術研究組織的認可,並擁有 5 位諾貝爾獎獲得者,9 份美國國家技術獎章,5 份美國國家科學獎章,6 份圖靈獎和 10 位美國發明家名人堂成員。

第 1 門課程 AI 工作流程 : 業務優先順序和資料擷取
這是一個由六個部分組成的專業的第 1 門課程。強烈建議你按順序完成這些課程,因為它們不是單獨的獨立課程,而是工作流程的一部分,其中每門課程都基於之前的課程。
IBM AI 企業工作流程認證專業課的第一門課程介紹專業的範圍和先決條件。具體來說,本課程為執業的資料科學家設計,讓科學家瞭解機率、統計、線性代數以及用於資料科學和機器學習的 Python 工具。假設有一家串流媒體公司將介紹給你做新客戶。你將學習設計思想的概念,用於組織大型企業 AI 專案的 IBM 框架。 你還將學習科學思維的基礎知識,因為區別經驗豐富的資料科學家和初學者的素質是創造性、科學思維。 最後,你將通過瞭解假設的媒體公司的資料,並使用 Python 和 Jupyter 筆記本建立資料接收管道來開始你的工作。
在本課程結束時,你應該能夠:
- 瞭解使用結構化流程進行資料科學的優勢
- 描述設計思維的階段如何與 AI 企業工作流相對應
- 討論用於考慮商機優先順序的幾種策略
- 解釋資料科學和資料工程在哪些方面與 AI 工作流程有最多重疊的部分
- 說明在資料攝取( data ingestion )的測試目的
- 描述稀疏矩陣( sparse matrices )的用例作為資料攝取的瞄準目標
- 瞭解可以採取的自動化資料攝取管道的初始步驟
誰應該上這門課程?
- 本課程針對具有建構機器學習模型專業知識的現有資料科學從業者,希望加深在大型企業中建構和部署 AI 的技能。
- 如果你有志成為資料科學家但還沒有經驗,那麼本課程不適合你,因為你需要實際的專業知識才能從這些課程的內容中受益。
你應該具備什麼技能?
在開始本課程之前,假定你對以下主題有紮實的理解:
- 對線性代數的基本理解;
- 瞭解抽樣、機率論和機率分佈;
- 瞭解描述性和推論性統計概念;
- 對機器學習技術和最佳實踐的一般瞭解;
- 對Python和資料科學中常用的軟體套件有實際的瞭解:NumPy、Pandas、matplotlib、scikit-learn;
- 熟悉IBM Watson Studio;
- 熟悉設計思維過程。
第 2 門課程 AI 工作流程 : 資料分析和假設檢驗
這是 IBM AI 企業工作流程認證專長的第 2 門課程。強烈建議你按順序完成這些課程,因為它們不是單獨的獨立課程,而是工作流程的一部分,其中每門課程都基於之前的課程。
在本課程中,你將通過進行探索性資料分析( EDA )開始為假設的串流媒體公司工作。作為工作的一部分,你將瞭解資料視覺化、處理缺失資料和假設檢驗的最佳實踐。你將學習具有機率分佈的估計技術,並將這些估計擴充到應用零假設重要性檢驗。你將通過兩個案例研究來應用所學到的知識:資料視覺化和使用簡單管道進行多次測試。
在本課程結束時,你應該能夠:
- 列出有關 EDA 和資料視覺化的幾種最佳實踐
- 在 Watson Studio 中建立一個簡單的儀錶板
- 描述處理缺失資料的策略
- 解釋歸因和多重歸因之間的區別
- 運用通用分佈來回答有關事件機率的問題
- 解釋假設檢驗在 EDA 的調查作用
- 應用幾種方法處理多重檢驗
誰應該上這門課程?
- 本課程針對具有建構機器學習模型專業知識的現有資料科學從業者,他們希望加深他們在大型企業建構和部署 AI 的技能
- 如果你是一位有志成為資料科學家,還沒有經驗,那麼本課程不適合你,因為你需要實際的專業知識才能從這些課程的內容中受益
你應該具備什麼技能?
假定你已完成 IBM AI 企業工作流程專業課程第 1 課,並且在開始本課程之前對以下主題有紮實的瞭解:
- 對線性代數的基本瞭解;
- 瞭解抽樣、機率論和機率分佈;
- 瞭解描述性和推論性統計概念;
- 對機器學習技術和最佳實踐的一般瞭解;
- 對 Python 和資料科學中常用的軟體套件有實際的瞭解:NumPy、Pandas、matplotlib、scikit-learn;
- 熟悉 IBM Watson Studio;
- 熟悉設計思維過程。
第 3 門課程 AI 工作流程 : 特徵工程和偏檢測
這是IBM AI 企業工作流程認證專長中的第 3 門課程。強烈建議你按順序完成這些課程,因為它們不是單獨的獨立課程,而是工作流的一部分,其中每門課程都基於之前的課程。
課程 3 向你介紹我們假設的媒體公司的工作流程的下一階段。在這一階段的工作中,你將學習有關特徵工程( feature engineering ),處理類別失衡( class imbalances )以及檢測資料偏差( bias )的最佳實踐。類別失衡( class imbalances )會嚴重影響你的機器學習模型的有效性,減輕資料偏差( bias )對於降低與偏差模型相關的風險至關重要。這些主題之後幾個章節將討論減少維度、離群值檢測( outlier detection )和在無監督學習技術下從資料中找出模式( patterns )於的最佳實踐。案例研究將集中於主題建模和資料視覺化。
在本課程結束時,你將能夠:
- 使用有助於解決類別和類別失衡問題的工具
- 解釋有關資料偏差( bias )的道德考量
- 使用 Fairness 360 開源程式庫來檢測模型中的偏差( bias )
- 在 EDA 和轉換階段均採用降維技術
- 描述自然語言處理中的主題建模技術
- 使用主題建模和視覺化來探索文字資料
- 在高維資料中採用離群值處理最佳實踐
- 將離群值檢測演算法用為品質保證工具和建模工具
- 採用無監督學習技術做 AI 工作流程的一部分運用管道
- 採用基本的叢集 ( clustering )演算法
誰應該上這門課程?
- 本課程針對具有建構機器學習模型專業知識的現有資料科學從業者,他們希望加深他們在大型企業建構和部署 AI 的技能
- 如果你是一位有志成為資料科學家,還沒有經驗,那麼本課程不適合你,因為你需要實際的專業知識才能從這些課程的內容中受益
你應該具備什麼技能?
假定你已完成 IBM AI 企業工作流程專業課程第 1 、 2 課,並且在開始本課程之前對以下主題有紮實的瞭解:
- 對線性代數的基本瞭解;
- 瞭解抽樣、機率論和機率分佈;
- 瞭解描述性和推論性統計概念;
- 對機器學習技術和最佳實踐的一般瞭解;
- 對 Python 和資料科學中常用的軟體套件有實際的瞭解:NumPy、Pandas、matplotlib、scikit-learn;
- 熟悉 IBM Watson Studio;
- 熟悉設計思維過程。
第 4 門課程 AI 工作流程 : 機器學習、視覺辨識和 NLP
這是IBM AI 企業工作流程認證專長中的第 4 門課程。強烈建議你按順序完成這些課程,因為它們不是單獨的獨立課程,而是工作流的一部分,其中每門課程都基於之前的課程。
課程 4 涵蓋了工作流程的下一階段,為一家假設的串流媒體公司建立了模型及其相關的資料管道。 第一個主題涵蓋評估指標的複雜主題,你將在其中學習許多不同指標的最佳實踐,包括迴歸指標( regression metrics )、分類指標( classification metrics )和多類別指標( multi-class metrics ),你將使用這些最佳方法來選擇應對業務挑戰的最佳模型。 接下來的主題涵蓋了不同類型的模型的最佳實踐,包括線性模型( linear models )、基於樹的模型( tree-based models )、和神經網路( neural networks )。 將使用用於自然語言( natural language )理解和視覺識別的開箱即用( Out-of-the-box )的 Watson 模型。 我們將做案例研究,聚焦於自然語言處理和影像分析,以為模型管道提供真實的環境。
在本課程結束時,你將能夠:
- 討論常見的迴歸、分類和多標籤分類指標
- 解釋在有監督的學習應用中線性迴歸和邏輯迴歸的使用
- 描述網格搜尋和交叉驗證的通用策略
- 運用評估指標選擇用於生產的模型
- 說明監督學習的應用程式上基於樹的演算法
- 說明監督學習的應用程式上神經網路的運用
- 討論神經網路的主要變化和最新進展
- 在 Tensorflow 中建立神經網路模型
- 建立並測試 Watson Visual Recognition 例項( instance )
- 建立並測試 Watson NLU 例項( instance )
誰應該上這門課程?
- 本課程針對具有建構機器學習模型專業知識的現有資料科學從業者,他們希望加深他們在大型企業建構和部署 AI 的技能
- 如果你是一位有志成為資料科學家,還沒有經驗,那麼本課程不適合你,因為你需要實際的專業知識才能從這些課程的內容中受益
你應該具備什麼技能?
假定你已完成 IBM AI 企業工作流程專業課程第 1 到第 3 課,並且在開始本課程之前對以下主題有紮實的瞭解:
- 對線性代數的基本瞭解;
- 瞭解抽樣、機率論和機率分佈;
- 瞭解描述性和推論性統計概念;
- 對機器學習技術和最佳實踐的一般瞭解;
- 對 Python 和資料科學中常用的軟體套件有實際的瞭解:NumPy、Pandas、matplotlib、scikit-learn;
- 熟悉 IBM Watson Studio;
- 熟悉設計思維過程。
第 5 門課程 AI 工作流程 : 企業模型部署
這是IBM AI 企業工作流程認證專長中的第 5 門課程。強烈建議你按順序完成這些課程,因為它們不是單獨的獨立課程,而是工作流的一部分,其中每門課程都基於之前的課程。
本課程向你介紹一個很少有資料科學家能夠體驗的領域:部署用於大型企業的模型。 Apache Spark 是執行機器學習模型的非常常用的框架。本課程將介紹使用 Spark 的最佳做法。還將介紹資料處理( data manipulation )、模型訓練( model training )和模型調整( model tun\ing ) 的最佳實踐。用例將要求建立和部署推薦系統。本課程最後以模型部署技術的介紹做總結。
在本課程結束時,你將能夠:
- 使用 Apache Spark 的 RDD、資料幀( dataframes )和管道( pipeline )
- 使用 Spark 提交的指令碼( spark-submit scripts )與 Spark 環境進行互動
- 解釋協作過濾( collaborative filtering )和基於內容的過濾( content-based filtering )的工作原理
- 使用 Apache Spark 和 Apache Spark 串流建構資料提取管道( data ingestion pipeline )
- 在 Apache Spark 上分析機器學習模型中的超參數( hyperparameters )
- 使用 Apache Spark 機器學習介面部署機器學習演算法
- 從 Watson Studio 到 Watson Machine Learning 部署機器學習模型
誰應該上這門課程?
- 本課程針對具有建構機器學習模型專業知識的現有資料科學從業者,他們希望加深他們在大型企業建構和部署 AI 的技能
- 如果你是一位有志成為資料科學家,還沒有經驗,那麼本課程不適合你,因為你需要實際的專業知識才能從這些課程的內容中受益
你應該具備什麼技能?
假定你已完成 IBM AI 企業工作流程專業課程第 1 到 第 4 課,並且在開始本課程之前對以下主題有紮實的瞭解:
- 對線性代數的基本瞭解;
- 瞭解抽樣、機率論和機率分佈;
- 瞭解描述性和推論性統計概念;
- 對機器學習技術和最佳實踐的一般瞭解;
- 對 Python 和資料科學中常用的軟體套件有實際的瞭解:NumPy、Pandas、matplotlib、scikit-learn;
- 熟悉 IBM Watson Studio;
- 熟悉設計思維過程。
第 6 門課程 AI 工作流程 : 生產中的 AI
這是IBM AI 企業工作流程認證專長中的第 6 門課程。強烈建議你按順序完成這些課程,因為它們不是單獨的獨立課程,而是工作流的一部分,其中每門課程都基於之前的課程。
本課程側重於假設的串流媒體公司生產中的模型。這裡有 IBM Watson Machine Learning 的簡介。你將在 Docker 容器中構建自己的 API ,並學習如何使用 Kubernetes 管理容器。本課程還介紹了 IBM 生態系統中的其他一些工具,這些工具旨在幫助在生產中部署或維護模型。 AI 工作流程不是線性過程,因此有一些時間專用於最重要的反饋迴圈,以促進整個工作流程的高效迭代。
在本課程結束時,你將能夠:
- 使用 Docker 部署 Flask 應用程式
- 部署簡單的 UI 以整合 ML 模型、Watson NLU 和 Watson Visual Recognition
- 討論基本的 Kubernetes 術語
- 在 Kubernetes 上部署可擴展的 Web 應用程式
- 討論在 AI 工作流程中不同的反饋循環
- 討論在模型生產的環境中單元測試的使用
- 使用 IBM Watson OpenScale 評估生產中機器學習模型的偏差( bias )和性能( performance )
誰應該上這門課程?
- 本課程針對具有建構機器學習模型專業知識的現有資料科學從業者,他們希望加深他們在大型企業建構和部署 AI 的技能
- 如果你是一位有志成為資料科學家,還沒有經驗,那麼本課程不適合你,因為你需要實際的專業知識才能從這些課程的內容中受益
你應該具備什麼技能?
假定你已完成 IBM AI 企業工作流程專業課程第 1 到 第 5 課,並且在開始本課程之前對以下主題有紮實的瞭解:
- 對線性代數的基本瞭解;
- 瞭解抽樣、機率論和機率分佈;
- 瞭解描述性和推論性統計概念;
- 對機器學習技術和最佳實踐的一般瞭解;
- 對 Python 和資料科學中常用的軟體套件有實際的瞭解:NumPy、Pandas、matplotlib、scikit-learn;
- 熟悉 IBM Watson Studio;
- 熟悉設計思維過程。
到官方網站了解本課程與上課
你可能會有興趣
- Coursera 前十大最受歡迎課程
- 資料科學與機器學習相關線上課程
- ★想要加強英文能力嗎?– 練好英文是最大的學習槓桿
- 追蹤這個 Twitter ,追蹤各種軟體開發和個人成長學習訊息
★ 歡迎使用 App / Email | Telegram 訂閱 網站更新★
你必須登入才能發表留言。