檢索增強生成(Retrieval-Augmented Generation (RAG))

RAG 是一種結合資訊檢索與文本生成的技術框架,讓大型語言模型能即時查詢外部知識庫,產出更準確、可溯源的回答。

完整說明

檢索增強生成(Retrieval-Augmented Generation, RAG)由 Meta AI 於 2020 年提出,目的是解決 LLM 的知識過時和幻覺問題。RAG 的運作流程分為三步:首先將使用者的提問轉換為向量(Embedding),然後在外部知識庫中檢索最相關的文件片段,最後將檢索結果與原始提問一起傳給 LLM 生成回答。這種做法讓 LLM 能存取訓練資料之外的最新資訊,且回答可附上來源引用,增加可信度。RAG 已成為企業部署 AI 助手的主流架構,因為它不需要重新訓練模型就能整合企業內部知識。

iPAS 考試出題分析

根據歷年 iPAS AI 應用規劃師考古題統計,檢索增強生成 相關題目 平均佔 AI 技術類考題 10%, 屬於高頻考範圍。

常見出題方向包含:RAG 架構與流程(佔 45%)、RAG 與微調比較(佔 30%)、RAG 應用場景(佔 25%)。

相關術語

常見問題

RAG 如何解決 LLM 的幻覺問題?

RAG 讓 LLM 根據檢索到的真實文件內容來回答問題,而非僅依賴訓練時記憶的知識。這大幅降低了模型「瞎編」的機率,且回答可附上來源文件供使用者驗證。

RAG 的技術挑戰是什麼?

主要挑戰包括:1. 檢索品質直接影響回答品質;2. 文件分割(Chunking)策略影響檢索精準度;3. 向量資料庫的選擇和優化;4. 檢索結果與 LLM 上下文窗口的長度限制。

範例考題

RAG 的標準運作流程,下列哪個順序最正確?

  • A. 生成回答 → 檢索文件 → 提問
  • B. 提問 → 向量化查詢 → 檢索相關文件 → 結合上下文生成回答 ✓ 正確答案
  • C. 微調模型 → 提問 → 生成回答
  • D. 提問 → 直接生成回答 → 檢索驗證

解析:

RAG 的標準流程是:使用者提問 → 將問題轉為向量 → 在向量資料庫中檢索最相關的文件片段 → 將檢索結果和原始問題一起送給 LLM → 生成有根據的回答。

企業想讓 AI 助手能回答內部最新的產品文件問題,最適合的技術方案是?

  • A. 從頭訓練一個專屬 LLM
  • B. 使用 RAG 架構整合內部文件知識庫 ✓ 正確答案
  • C. 增加模型的參數量
  • D. 使用更多的預訓練資料

解析:

RAG 最適合此場景,因為企業內部文件會持續更新,RAG 可即時檢索最新內容而不需重新訓練模型。微調需要花費時間和算力,且每次文件更新都要重新微調,不符合「最新」的需求。

延伸學習

深入了解 檢索增強生成 的完整運作原理

延伸學習

想看 檢索增強生成 的完整影片教學?前往 美第奇 AI 學院

立即測驗

想測試你對 檢索增強生成 的掌握程度? 開始模擬考