Prompt 壓縮和查詢優化

本課程重點介紹如何將傳統資料庫功能與向量搜尋功能結合,以優化大規模檢索增強生成 (RAG) 應用程式的效能和成本效益。

關於此專業課程

本課程重點介紹如何將傳統資料庫功能與向量搜尋功能結合,以優化大規模檢索增強生成 (Retrieval Augmented Generation。RAG) 應用的效能和成本效益。

您將學習如何應用以下關鍵技術:

  1. 預過濾和後過濾:這些技術用於根據特定條件過濾結果。預過濾在資料庫索引建立階段完成,而後過濾在向量搜尋執行後套用。
  2. 投影:此技術涉及選擇查詢返回欄位的子集,以最小化輸出的大小。
  3. 重新排序:這涉及根據其他資料欄位對搜尋結果進行重新排序,以使更理想的結果在清單中排名更高。
  4. 提示壓縮:此技術用於縮短提示的長度,在大規模應用程式中,處理提示可能成本高昂。

您還將透過實踐練習學習如何:

  1. 使用 MongoDB 實作 RAG 的向量搜尋。
  2. 開發多階段 MongoDB 聚合管道。
  3. 使用元資料優化和限制資料庫操作傳回的搜尋結果,從而提高效率和相關性。
  4. 透過在 MongoDB 聚合管道中合併投影階段來簡化資料庫操作的輸出,減少返回的資料量並優化效能、記憶體使用和安全性。
  5. 重新排序文件以提高資訊檢索的相關性和質量,並使用元資料值確定重新排序的位置。
  6. 實現快速壓縮,並直觀地了解如何使用它以及它為 LLM 應用程式帶來的操作優勢。

開始使用快速壓縮和查詢最佳化技術來優化 RAG 應用程式的效率、安全性、查詢處理速度和成本。

到官方網站了解本課程與上課

應用的學習專案

在本專業課程,你將完成 2 個專案。 第一個提供你計算機安全方面的實踐經驗。 第二個是產品拆解,它給你有關如何構建產品的關鍵見解。 作為第二個專案的一部分,你將構建材料清單( 又稱BOM,Bill of Materials ) 。

你將學到的內容有

  • 將向量搜尋功能與傳統資料庫操作結合,建立高效且經濟高效的 RAG 應用程式。
  • 了解如何使用預過濾、後過濾和投影技術來加快查詢處理速度並最佳化查詢輸出。
  • 使用提示( prompt )壓縮技術來縮短在大型應用程式中處理成本高昂的提示( prompts )的長度。

你將獲得的技能:

操作性資料庫MongoDB Prompt Engineering
Large Language Modeling( LLM )資料管道查詢語言
元資料管理效能調優

字幕

英文

製作方

DeepLearning.AI

DeepLearning.AI 是一家致力於打造全球 AI 人才社群的教育科技公司。 DeepLearning.AI 的專家主導的教育體驗,為 AI 從業者和非技術專業人士提供從基礎到高級應用的全方位學習工具,賦能他們構建 AI 賦能的未來。

到官方網站了解本課程與上課

Sponsored by Coursera


你可能會有興趣

不受 FB 演算法影響,歡迎透過 e-mail 訂閱網站更新

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

由 WordPress.com 建置.

Up ↑

探索更多來自 Soft & Share 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading