fbpx

自然語言處理: Python 的機器學習 NLP

完整的初學者 NLP 教學大綱。實用:語言學、Flask、Sentiment、Scrape Tweets、Chatbot、Hugging Face 等等!

從這 19.5 小時的課程,你會學到

  • 使用 Flask 將情感分析模型部署到 Web 界面
  • 程式庫:Hugging Face、NLTK、SpaCy、Keras、Sci-kit Learn、Tensorflow、Pytorch、Twint
  • 語言學基礎會幫助學習 NLP 概念
  • 深度學習:神經網路、RNN、LSTM 理論和實踐專案
  • 使用開源智慧工具抓取無限推文
  • 機器閱讀理解:使用 SQuAD 創建問答系統
  • 無需繁瑣的 Anaconda 或 Jupyter 安裝:使用現代 Google Colab 基於雲的筆記本來使用 Python
  • 如何建構生成式 AI 聊天機器人
  • 使用 Word2Vec 創建 Netflix 推薦系統
  • 對 Steam 遊戲評論進行情緒分析
  • 將語音轉換為文本
  • 機器學習建模技術
  • 馬可夫( Markov )屬性 – 理論與實踐
  • 初學者的可選 Python 部分
  • 餘弦( Cosine )相似度和向量
  • 詞嵌入( Word Embeddings ):深入教授我最喜歡的主題
  • 語音識別
  • LSTM 假新聞檢測器
  • 上下文無關語法
  • 抓取維基百科並創建文章摘要器

要求

  • 沒有繁瑣的安裝
  • 不需要以前的程式知識。 當你和我一起編寫程式碼時,這些講座會慢慢解釋 Python 語法。
  • Python 新手:你會在與我一起編寫程式碼時獲得對程式碼的解釋,但不僅如此 – 理論簡報解釋概念以幫助你了解程式碼背後發生的事情。
  • 不需要資料科學知識:講座教授如何使用資料和關鍵建模概念。
  • 無需 NLP 知識。 甚至在你開始實際程式碼之前,就教授語言概念為 NLP 打下堅實的基礎。 這有助於你更好地掌握 NLP 建模技術和清洗概念。

課程說明

本課程將帶你從初學者到能夠理解 NLP 概念、語言學理論,然後使用 Python 練習這些基本理論——你和我一起編寫非常簡單的示例。

使用超過 50,000 條推文的大數據集,獲得從收集你自己的資料到 NLP 情感分析的完整真實工作流程的經驗。

  • 資料收集:使用以下方法抓取 Twitter:OSINT – 開源情報工具:使用真實世界的技術收集文本資料。 在現實世界中,在許多情況下,你必須創建自己的資料集; 即獲取你的資料,而不是在線下載乾淨、現成的檔案
  • 使用 Python 搜索相關推文以供你學習,並使用 NLP 分析情緒。

語言語法:大多數 NLP 課程忽略了語言學的核心領域。 本課程解釋了語言語法( Language Syntax )和解析樹( Parse trees )的基礎——機器如何解釋句子結構的基礎。

Python 新手:如果你不熟悉 Python 或任何電腦程式,課程說明可讓你輕鬆與我一起編寫程式碼。 我逐行解釋。

無需安裝,我們直接進行編寫程式 – 使用 Google Colab 進行程式碼編輯 – 以了解 2021 年資料科學世界的最新動態!

緩慢的步伐將你逐漸從 NLP 基礎的這些基礎知識帶入能夠理解深度學習的數學和語言(基於英語語言,非數學)理論。

自然語言處理基礎

  • 語言學和語義學 – 研究自然語言的背景理論,以更好地理解電腦科學應用
  • 預處理資料(清洗)
  • 正則表達式、標記化、詞幹提取、詞形還原
  • 名稱實體識別 (NER)
  • 詞性標註

SQuAD

SQuAD – Stanford 問答資料集。在這個很棒的 SQuAD 資料集上訓練你的問答模型。

Libraries:

  • NLTK
  • Sci-kit Learn
  • Hugging Face
  • Tensorflow
  • Pytorch
  • SpaCy
  • Twint

下面概述的主題是使用實際的 Python 專案教授的!

  • 解析樹( Parse Tree )
  • 馬可夫鏈 ( Markov Chain )
  • 文本分類和情感分析
  • 公司名稱生成器
  • 無監督情緒分析
  • 主題建模
  • 使用深度學習模型進行詞嵌入
  • 封閉領域問答 (喜歡就許多不同的話題提問,從碧昂絲到伊朗美食)
  • LSTM 使用 TensorFlow、Keras 序列模型
  • 語音識別
  • 將語音轉換為文本

神經網路

  • 這是從第一原理講授的 – 將人腦中的生物神經元與人工神經元進行比較。
  • 實戰專案:Steam 評論情緒分析

詞嵌入:詳細介紹了該主題,類似於本科課程結構,包括以下理論和實踐示例:

  • TF-IDF
  • Word2Vec
  • One Hot Encoding
  • gloVe

深度學習

  • 遞歸神經網路 ( Recurrent Neural Networks,RNN )
  • LSTMs
    • 了解長短期記憶和深度學習領域中使用的循環神經網路架構。
    • 使用 LSTM 建構模型

目標受眾

  • 任何對資料科學和 NLP 感興趣的人
  • 那些在商業和行銷領域的人——學習使用 NLP 來深入了解客戶和產品。 可以幫助面試和工作晉升。
  • 如果你打算報讀 NLP/資料科學課程,但完全是新手,請先完成這門課程,以免在課堂上迷路,因為如果同學已經有 Python 或資料科學基礎,這可能會讓人不知所措。

講師簡介

Nidia Sahjara NLP 工程師和研究員

Nidia 擁有多元化的背景,因為她的本科學習包括英國德比大學的計算機科學和西印度群島大學的土木與環境工程。 她目前的研究涉及使用 NLP 分析社會科學領域的開源資料和意見挖掘解決方案。 她目前就讀於 2021 年在倫敦國王學院繼續她的研究生學習。

Rajeev D. Ratan 資料科學家、電腦視覺專家和電機工程師

大家好,我是 Rajeev,一位資料科學家和電腦視覺工程師。

我擁有愛丁堡大學的計算機與電機工程學士學位和人工智慧碩士學位,在那裡我獲得了機器學習、電腦視覺和智慧機器人技術的廣泛知識。

我發表了關於使用資料驅動方法進行公共交通概率隨機建模的研究,甚至是在愛丁堡大學贏得機器人競賽的小組的一員。

我創辦了自己的電腦視覺初創公司,該公司基於在教育中使用深度學習,從那時起,我一直在為另外兩家電腦視覺領域的初創公司和一家資料科學領域的跨國公司做出貢獻。

此前,我在加勒比地區最大的兩家電信運營商工作了 8 年,在那裡他獲得了管理技術人員和部署複雜電信項目的經驗。

英文字幕:有

  • 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To

使用 Notion 來做上課筆記?

udemy 的課程講座數量動輒上百個,如果你要使用 Notion 當作是線上課程的筆記輔助工具,為這些講座建立與組織筆記是一件耗時且沒效率的工作

為了解決這個問題,Soft & Share 開發一個 chrome extension – LN+ for udemy ,可以根據 udemy 線上課程的課程大綱幫你自動建立成 Notion 筆記資料庫並產生筆記與課程的雙向關聯讓您專心上課與寫筆記就好,不用再煩惱課程筆記要放哪裡的問題!

🛫了解 LN+ for udemy 更多功能介紹請參考 – Learning Notes Plus for udmy


報名參加課程

Sponsored by Udemy


🛫使用關鍵字連結獲得更多線上學習資訊?請參考這個網頁說明


幫我們個小忙!

使用 e-mail 追蹤 Soft & Share

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

Powered by WordPress.com.

Up ↑

%d 位部落客按了讚: