Langchain v1 AI 代理、多模式深度代理、多代理深度高級 RAG、Google Gemini 3、Qdrant、Docker、Docling
從這 20 小時的課程,你會學到
- 使用 Google Gemini、LangChain v1、MCP 和現代 Agent 設計模式建立可用於生產環境的 AI Agents。
- 使用 Docling、Gemini、Qdrant 向量資料庫和混合搜尋設計並實現多模態 RAG 管線。
- 使用 Docling、Docker 和結構化資料擷取技術大規模處理 PDF、表格和映像。
- 在實際 AI 系統中實現混合搜尋、重新排序、記憶體管理、MCP 工具和成本優化的上下文快取。
- 為金融應用場景創建包含協調器、研究員和編輯 agents 的自主多 agent 研究系統。
要求
需要具備基本的Python知識。熟悉API、Docker或RAG概念會有幫助,但並非必要。
課程說明
本課程是一份完整的實作指南,指導您使用 Google Gemini、LangChain v1、MCP 和現代 RAG 技術建立真實世界的 AI 代理和深度研究(DeepAgent)系統。
您將從 AI 代理的基礎知識入手,逐步建立用於深度金融研究的高級自主多代理系統。本課程採用循序漸進的設計,既能讓初學者輕鬆跟上,也能讓經驗豐富的開發者學習到高階的生產級模式。
本課程的重點不僅限於理論。您將使用 Python notebook、真實 API、真實文件和真實資料管道,一步一步建立所有內容。
課程內容
首先,您將了解 AI 代理的真正含義。您將學習不同的代理模式、代理的推理方式、代理的行動方式,以及如何為實際專案選擇合適的代理設計。
接下來,您將正確設定 Google Gemini AI Studio 和 LangSmith。這包括建立 API 金鑰、了解定價、速率限制以及追蹤代理執行情況,以便您像專業人士一樣調試和監控您的代理。
之後,您將參加完整的 Gemini 和 LangChain 速成班。您將學習如何在 Python 中使用 Gemini 模型,以了解訊息的內部工作原理、串流回應的工作原理、多模態輸入的處理方式,以及如何使用工具、函數呼叫、推理模式、接地和上下文快取來降低成本並提高效能。
掌握基礎知識後,您將開始學習 LangChain 代理。您將使用 Pydantic 建立具有記憶體、狀態管理、摘要中間件、回退模型、PII 保護、規劃器、串流回應和結構化輸出的代理程式。
課程隨後將透過一個金融用例介紹 MCP。您將連接外部 MCP 伺服器(例如 Yahoo Finance),將其作為 LangChain 工具加載,並建立具有結構化提示和規劃器的完整股票研究代理。
深度 RAG 和多模態金融系統
- 本課程的大部分內容都專注於金融領域的深度 RAG 系統。
- 您將學習多模態 RAG 的困難所在,PDF、表格、影像和長文件會遇到哪些問題,以及如何設計可靠的深度 RAG 管線。
- 您將使用 Docling 從金融 PDF 文件中提取資料。這包括將 PDF 轉換為 Markdown 格式、提取帶有上下文的表格、追蹤頁碼、提取圖像以及大規模驗證資料完整性。
- 然後,您將使用多模態 Gemini 模型產生準確的圖像描述,並將這些描述儲存在 Markdown 中,以便所有操作都可以在一個基於文字的管線中完成。
- 接下來,您將把大量多模態資料匯入 Qdrant 向量資料庫。您將學習密集搜尋、稀疏搜尋、混合搜尋、元資料過濾、使用檔案雜湊進行去重,以及分塊和檢索模型的最佳實踐。
- 此外,您還將使用混合搜尋和交叉編碼器重新排序來建立進階檢索管線,以提高檢索結果的品質。
建構真正的多 Agent 深度研究系統
在最後幾個章節中,您將從零開始建立完整的多 agent 深度研究系統。
您將設計能夠像專家研究團隊一樣工作的自主 agents,包括協調者、研究員和編輯者。這些 agents 規劃任務、運行深度研究、綜合結果並產生結構化輸出。
您將學習如何共享 agent 狀態、如何在運行時注入工具、如何管理 agents 的檔案,以及如何針對協調者、研究員和編輯者角色設計不同的提示。
您還將探索 LangChain 內建的深度 agent 架構,並使用子 agents 和檔案後端來建立完整的深度金融研究 agent。
本課程適合哪些人
本課程針對希望超越基礎聊天機器人,建構嚴肅人工智慧系統的開發者。
非常適合:
- 從事人工智慧和 LLM 相關工作的工程師
- 建構 RAG 系統的後端開發人員
- 從事文件和研究的資料科學家
- 對 AI 自動化有興趣的金融和分析專業人士
- 任何想要了解實際生產環境中多 Agent 系統建構方式的人士
建議具備 Python 基礎知識,但最好有一定 agent 或 RAG 開發經驗。
完成本課程後,您將能夠使用 Gemini 和 LangChain 設計、建造和debug 高級 AI Agents、多模態 RAG 管線以及自主多 agent 研究系統。
您不僅會理解概念,還將建立完整的端到端系統,這些系統可以在實際專案、新創公司或企業環境中重複使用。
目標受眾
AI 工程師、後端開發人員和資料科學家希望使用 LangChain、Docling、Docker 和 Qdrant 來建立基於 Gemini 的代理、多模態 RAG 系統和深度研究工作流程。
講師簡介
KGP Talkie | Laxmi Kant 印度理工學院克勒格布爾分校 | kgptalkie.com
Laxmi Kant Tiwari 畢業於印度理工學院克勒格布爾分校 (IIT Kharagpur),是一位擁有超過 10 年行業經驗的高級資料科學與人工智慧工程師,曾在多家新創公司和跨國公司任職。他曾參與機器學習、深度學習、LLM、LangChain、LangGraph、RAG 系統和 AI 代理工作流程的實際應用,並為生產環境提供可擴展的解決方案。
作為 mBreath Technologies 的聯合創始人,他打造了一款屢獲殊榮的無線健康監測系統,該系統在 2016 年印度理工學院孟買分校 (IIT Bombay) 的 Eureka 大賽中拔得頭籌,充分展現了他將複雜的 AI 理念轉化為真正可上市產品的能力。
透過他的全球教學平台 KGP Talkie,Laxmi 已在全球培訓了超過 10 萬名學生,教授 Python、機器學習、深度學習以及 LangChain、Ollama、GPT-OSS、Qwen3、Gemma3 和 Transformer 微調等前沿生成式 AI 技術。由於其清晰易懂、簡潔明了且高度注重實際應用,他的許多課程都成為了 Udemy 上的暢銷課程。
Laxmi 擁有超過 100 個人工智慧/機器學習課程的實務經驗,並在印度理工學院 (IIT) 任教,他將深厚的學術功底與實用的工程技能完美結合。他的目標是幫助學生從基礎理論過渡到建立真正的生產級人工智慧系統,包括 RAG 管線、智慧代理、記憶系統和多模態人工智慧工具。
字幕:英文
- 想要了解如何將英文字幕自動翻譯成中文? 請參考這篇 How-To
- Udemy 永久擁有課程 許多課程約 NT350 (點擊連結看更多)
- ✨年訂閱每月 NT350 🌈 悠遊 Udemy 的 26000+ 門課,最大化學習 ( 原價 NT635/月 )
- Udemy 現在越來越多課程有中文字幕,請參考 Soft & Share 中文線上課程
- 手機上點選優惠連結看到的價格比電腦上看到的貴
- $代表當地貨幣, 如在台灣為 NT
- 點選”報名參加課程”有可能因瀏覽器 cookies 轉久一點或回報錯誤而無法連上,請稍等刷新或重新點選就會出現
報名參加課程

也許你會有興趣
- 相關線上課程
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入
發表迴響