檢索增強生成(Retrieval-Augmented Generation (RAG))
RAG 是一種結合資訊檢索與文本生成的技術框架,讓大型語言模型能即時查詢外部知識庫,產出更準確、可溯源的回答。
完整說明
檢索增強生成(Retrieval-Augmented Generation, RAG)由 Meta AI 於 2020 年提出,目的是解決 LLM 的知識過時和幻覺問題。RAG 的運作流程分為三步:首先將使用者的提問轉換為向量(Embedding),然後在外部知識庫中檢索最相關的文件片段,最後將檢索結果與原始提問一起傳給 LLM 生成回答。這種做法讓 LLM 能存取訓練資料之外的最新資訊,且回答可附上來源引用,增加可信度。RAG 已成為企業部署 AI 助手的主流架構,因為它不需要重新訓練模型就能整合企業內部知識。
iPAS 考試出題分析
根據歷年 iPAS AI 應用規劃師考古題統計,檢索增強生成 相關題目 平均佔 AI 技術類考題 10%, 屬於高頻考範圍。
常見出題方向包含:RAG 架構與流程(佔 45%)、RAG 與微調比較(佔 30%)、RAG 應用場景(佔 25%)。
相關術語
常與之比較
常見問題
RAG 如何解決 LLM 的幻覺問題?
RAG 讓 LLM 根據檢索到的真實文件內容來回答問題,而非僅依賴訓練時記憶的知識。這大幅降低了模型「瞎編」的機率,且回答可附上來源文件供使用者驗證。
RAG 的技術挑戰是什麼?
主要挑戰包括:1. 檢索品質直接影響回答品質;2. 文件分割(Chunking)策略影響檢索精準度;3. 向量資料庫的選擇和優化;4. 檢索結果與 LLM 上下文窗口的長度限制。
範例考題
RAG 的標準運作流程,下列哪個順序最正確?
- A. 生成回答 → 檢索文件 → 提問
- B. 提問 → 向量化查詢 → 檢索相關文件 → 結合上下文生成回答 ✓ 正確答案
- C. 微調模型 → 提問 → 生成回答
- D. 提問 → 直接生成回答 → 檢索驗證
解析:
RAG 的標準流程是:使用者提問 → 將問題轉為向量 → 在向量資料庫中檢索最相關的文件片段 → 將檢索結果和原始問題一起送給 LLM → 生成有根據的回答。
企業想讓 AI 助手能回答內部最新的產品文件問題,最適合的技術方案是?
- A. 從頭訓練一個專屬 LLM
- B. 使用 RAG 架構整合內部文件知識庫 ✓ 正確答案
- C. 增加模型的參數量
- D. 使用更多的預訓練資料
解析:
RAG 最適合此場景,因為企業內部文件會持續更新,RAG 可即時檢索最新內容而不需重新訓練模型。微調需要花費時間和算力,且每次文件更新都要重新微調,不符合「最新」的需求。
延伸學習
延伸學習
想看 檢索增強生成 的完整影片教學?前往 美第奇 AI 學院
立即測驗
想測試你對 檢索增強生成 的掌握程度? 開始模擬考