fbpx

NLP – 用 Python 實現自然語言處理

學習使用機器學習、Spacy、NLTK、SciKit-Learn、深度學習等進行自然語言處理

課程介紹:English 简中

從這 11.5 小時的課程,你會學到

  • 學習使用 Python 處理文字檔案
  • 學習如何使用 Python 處理 PDF 檔案
  • 利用正規表示式( Regular Expressions )在文字中進行模式搜索
  • 使用 Spacy 超快速標記( tokenization  )
  • 瞭解詞幹提取( Stemming )和詞形還原( Lemmatization )
  • 理解和 Spacy 比對的詞彙
  • 使用詞性標註( Part of Speech Tagging ) 自動處理多個原始文字檔
  • 理解命名實體識別( Named Entity Recognition )
  • 使用 Spacy 視覺化 POS 和 NER
  • 使用 SciKit-Learn 做文字分類
  • 使用隱含狄利克雷分佈模型( Latent Dirichlet Allocation )進行主題建模
  • 學習非負矩陣分解( Non-negative Matrix Factorization,NMF )
  • 運用 Word2Vec 演算法
  • 使用 NLTK 做情感分析( Sentiment Analysis  )
  • 使用深度學習建立自己的聊天機器人

要求

  • 瞭解一般的 Python
  • 有權安裝 Python 套件的電腦
  • 可連接網際網路

課程說明

歡迎來到網路上最好的自然語言處理課程! 本課程旨在成爲你學習以 Python 程式設計做自然語言處理的完整線上資源。

在本課程中,我們將涵蓋你需要學習的所有知識,以便成爲一名使用 Python 的世界級 NLP 實踐者。

我們將從基礎開始,學習如何使用 Python 打開並處理文字與 PDF 檔案,以及如何使用正規表示式在文字檔中搜索自訂的模式。

然後,我們將從自然語言處理的基礎開始,利用 Python 的自然語言工具包程式庫( Natural Language Toolkit library ),以及最先進的 Spacy 程式庫,其可用於超快速標記( ultra fast tokenization )、解析( parsing )、實體識別( entity recognition )和文字的詞形還原( lemmatization )。

我們將會理解一些基本的 NLP 概念,例如詞幹分析( stemming )、詞形還原( lemmatization ) 、停止的字彙( stop words )、片語比對( phrase matching )、標記化( tokenization )等等!

接下來我們將介紹詞性標註( Part-of-Speech tagging ),在這裏,Python 腳本將能夠自動將文字中的字彙分配給相應的詞類,比如名詞、動詞和形容詞,這是建構智慧語言系統的一個重要部分。

我們還將學習命名實體識別( named entity recognition ),允許你的程式碼通過提供文字資訊來自動理解金錢、時間、公司、產品等概念。

通過這些最先進的視覺化程式庫,我們將能夠實時查看這些關係。

然後,我們將繼續瞭解機器學習與 Scikit-Learn 進行文字分類,如自動建立機器學習系統,可以辨識正面和負面的電影評論,或垃圾與合法的電子郵件訊息。

我們將把這些知識擴展到更復雜的非監督式學習做自然語言處理,比如主題建模( topic modeling ),我們的機器學習模型將從原始文字檔案中檢測主題和主要概念。

本課程甚至涵蓋了一些高級主題,例如使用 NLTK 程式庫對文字進行情感分析( sentiment analysis ),以及使用 Word2Vec 演算法創建語義詞向量( semantic word vectors  )。

包含在這個課程是一個完整的部分致力於最先進的高級主題,如使用深度學習建立我們自己的聊天機器人( chat bots )!

你不僅可以從這門課程中獲得精彩的技術內容,還可以訪問我們與課程相關的問答論壇,以及我們的實時學生聊天頻道,這樣你就可以和其他學生合作完成專案,或者從我自己和課程教學助理那裏獲得課程內容方面的幫助。

所有這些都有一個 30 天的退款保證,所以你可以嘗試這個課程,不用冒任何風險。

你還在等什麼? 今天就成爲自然語言處理的專家吧!

課程中見囉!

Jose

目標受眾

  • 有興趣學習如何使用自然語言的 Python 開發人員

講師簡介

Jose Portilla  資料科學家 ( 更多講師主講課程介紹 )

Jose Marcial Portilla 擁有來自聖克拉拉(Santa Clara )大學的機械工程學士學位和碩士學位,也有多年資料科學和程式設計專業教練和培訓師的經驗。 他在各種領域如微流體 、材料科學和資料科學技術中有出版物和專利。在他的職業生涯中,他已經發展了分析資料的技能,他希望利用他在教學和資料科學方面的經驗,幫助其他人學習程式開發的能力、分析資料,以及清晰地呈現資料和漂亮的視覺化。目前他是 Pierian Data Inc. 的資料科學主管,為世界各地的各種公司提供現場資料科學和 python 培訓課程,包括瑞士信貸等頂級銀行。歡迎隨時在 LinkedIn 上與他聯繫,獲取有關面對面培訓課程的更多資訊。

英文字幕:有

  • 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To

優惠資訊

如何購買這門課程比較划算?可以參考課程優惠折扣連結


報名參加課程

Sponsored by Udemy

也許你會有興趣

 學習資訊不漏接-歡迎使用 App 訂閱發文通知 

這個網站採用 Akismet 服務減少垃圾留言。進一步瞭解 Akismet 如何處理網站訪客的留言資料

Powered by WordPress.com.

Up ↑

%d 位部落客按了讚: