使用 ViT( Vision Transformers )、元資料( Metadata )、進階分塊( Advanced Chunking )、混合搜尋( Hybrid Search )和 RAG 技術掌握非結構化資料
從這 3 小時的課程,你會學到
- 掌握非結構化資料處理:學習如何有效地擷取、處理和標準化來自不同文件格式(包括 PDF、PowerPoint)的資料
- 實施高級元資料豐富:了解如何使用全面的元資料豐富文檔,從而實現更準確和相關的資料檢索
- 應用視覺模型和分塊技術:獲得應用 ViT 等視覺模型和高階分塊方法進行管理、分析的實用技能
- 建置和部署混合搜尋引擎:開發和部署將基於內容的檢索與元資料驅動的查詢相結合的混合搜尋引擎
要求
- 基本程式設計知識:熟悉程式設計概念,特別是 Python 和 JavaScript,將幫助學習者更有效地理解和應用課程內容。
- 熟悉 AI 概念:對 AI、LLM 或機器學習( ML )的基本了解將使你更容易掌握課程中涵蓋的資料預處理和 RAG 概念。
課程說明
透過這個關於使用先進技術將非結構化資料轉化為可行見解的綜合課程,釋放非結構化資料的力量並提升你的 AI 驅動的應用程式。無論你是開發人員、資料科學家還是人工智慧愛好者,本課程都將提供你從不同文件格式(包括 PDF、PowerPoint、Word 文件、HTML 頁面、表格和圖像)中提取、處理和標準化內容的技能— 為複雜的RAG 系統和大型語言模型(LLM) 做好資料準備。
在本實作課程中,你將深入研究非結構化框架,這是一個用於管理和規範化非結構化資料的強大工具。我希望你了解如何使用元資料( metadata )來豐富文件、應用高級分塊技術以及使用混合搜尋方法來增強資料檢索和生成程序(generation processes )。專注於現實世界的應用程式,你將獲得使用 ViT 等視覺模型預處理文件、透過表格轉換器提取有價值的資訊以及將這些組件無縫整合到 RAG 支援的應用程式中的實務經驗。
你將學到什麼:
- 掌握非結構化框架:了解如何利用非結構化框架來處理和標準化不同的資料類型,優化它們以在 RAG 系統和法學碩士中使用。
- 進階元資料擷取:學習使用全面的元資料豐富你的文檔,提高人工智慧驅動的應用程式中的搜尋準確性和相關性。
- 實作尖端分塊技術:應用先進的分塊方法來管理和處理大型資料集,確保高效率的資料處理和檢索。
- 利用混合搜尋功能:探索將元資料和基於內容的檢索結合的混合搜尋技術,從而提高查詢引擎的效能。
- 使用 ViT 進行文件影像分析:利用 ViT 和表格轉換器等視覺模型來分析和預處理文件影像,從而增強提取和利用非結構化資料的能力。
為什麼選擇這門課?
本課程專為想要超越基本資料處理並深入研究管理 RAG 系統中非結構化資料的高級技術的專業人士而設計。透過一系列實際專案,你將獲得建置和部署強大的、可擴展的資料引擎的專業知識,這些引擎可以處理複雜的查詢並產生上下文相關的回應。無論你是想增強當前的技能還是探索 AI 驅動開發的新領域,本課程都可以提供你成功所需的知識和實踐經驗。
加入我們,掌握將非結構化資料轉換為 RAG 系統和 LLM 應用程式強大的結構化見解的藝術!
目標受眾
- 開發人員和程式設計師
- 希望擴展非結構化資料處理、元資料豐富和檢索增強生成 (RAG) 系統創建方面知識的資料科學家和 人工智慧愛好者。
- 在資料規範化、分塊和混合搜尋至關重要的領域工作的技術專業人員,以及希望使用非結構化框架和視覺轉換器 (Vision Transformers,ViT) 實施強大解決方案的技術專業人員。
- 有興趣利用尖端技術預處理和管理不同文件格式(例如 PDF、PowerPoint 和 HTML)以增強機器學習和 LLM 應用程式的 AI 和 ML 從業者。
講師簡介
Paulo Dichone | 軟體工程師, AWS Cloud 從業者 & 講師 Android、Flutter、AWS、最暢銷講師
嗨,我是 Paulo。
我熱衷於教授 Android、Java 和 Flutter 開發。 我在全球 175 個國家教過超過 20 萬名學生。
我在行動應用程式開發(Android 和 iOS)、Web 開發和 AWS 雲端方面擁有豐富的經驗。
我的目標是讓你成為優秀的開發人員和 AWS 雲端實踐者,無論你的經驗如何。 此外,我喜歡與成長中的家人共度時光、彈吉他曼陀林以及在空閒時間旅行。
我期待幫助你成為最好的開發人員和 AWS 雲端從業者。
如果你對 Android 開發和我的課程不熟悉,我建議你從我最全面的 Android 課程開始:
- 全面的 Android 應用開發大師班 – 你將學習 Android 開發入門所需的一切 – 無需任何經驗!
下一個:
- 完整的中級 Android 大師班 – 你將學習中級 Android 主題,例如工作管理器 API、ROOM 資料庫以及在 Android 後台工作。
跨平台開發課程和網路相關(建立 iOS 和 Android 行動應用程式):
- Flutter & Dart – 完整的 Flutter 應用程式開發課程 – 學習 Dart 程式語言並使用單一程式碼庫建立 iOS 和 Android 應用程式。
- Angular & Dart – 使用 Angular 和 Dart 建立動態 Web 應用程式 – 釋放最常用的 Web 開發框架之一 Angular 和 Dart 的強大功能來建立動態 Web 應用程式。
- TornadoFX – 使用 Kotlin 建立 JavaFX 應用程式 – 利用現代程式語言、Kotlin 和 JavaFX 程式庫建立令人驚嘆的桌面應用程式
對於 AWS 雲端課程:
- Amazon EC2 大師班(包含自動擴展和負載平衡器)
- Amazon ECS 和 Fargate 大師班
- Amazon EKS 與 Kubernetes
- AWS AppSync 和 Amplify
- AWS Lambda 和無伺服器框架
純Java基礎課程:
- Java 大師班 – 從初學者到專家指南 – 想要從頭開始學習 Java? 那麼這就是你需要的課程。
- Java 設計模式 – 完整的大師班 – 了解如何使用經過充分測試、經過驗證的設計模式來建立可靠的軟體。
我期待在我的課程中見到你。
字幕:英文
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
- Udemy 永久擁有課程 NT310 起特價中(點擊連結看更多)
- ✨年訂閱每月 NT350( 限時優惠價NT245/月) 🌈 悠遊 Udemy 的 26000+ 門課,最大化學習 ( 原價 NT635/月 )
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程

也許你會有興趣
- LLM 相關線上課程
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入
發表迴響