最後更新:2026/04/10 Markdown 版本 外部參考來源

檢索增強生成(Retrieval-Augmented Generation)

檢索增強生成是先檢索知識庫,再將結果與問題一同輸入大型語言模型,以生成答案的技術

一句話理解

RAG 就像開卷考試 -- AI 回答問題前先查資料庫找到相關內容,再根據找到的資料生成答案,而不是完全靠記憶回答

容易混淆

vs 純 LLM 生成:純 LLM 像閉卷考(靠記憶,容易瞎編),RAG 像開卷考(有參考資料,更準確)。vs 微調:微調改變模型本身,RAG 不改模型,只是在回答前提供參考資料

關鍵因果

因為 LLM 容易產生幻覺(編造不存在的資訊),而且訓練資料有時效性,所以 RAG 被發明來讓 AI 能引用最新且真實的資料來回答

完整說明

檢索增強生成是什麼?

檢索增強生成(Retrieval-Augmented Generation,RAG)是一種結合了資訊檢索與大型語言模型(LLM)的 AI 技術。它先從外部知識庫中檢索與使用者提問相關的文件,然後將檢索到的文件連同原始問題一起輸入 LLM,讓 LLM 基於這些資訊生成更準確、更具參考價值的答案。這種方法讓 LLM 能夠利用外部知識,克服自身知識的侷限性,尤其是在需要處理特定領域或最新資訊的任務中,RAG 展現了強大的優勢。

檢索增強生成的運作原理

檢索增強生成的核心機制可以分為以下幾個步驟:

  1. 問題理解: 首先,系統接收使用者的提問,並對提問進行語義分析,理解使用者的意圖。
  2. 資訊檢索: 根據理解後的提問,系統從預先建立的知識庫(例如向量資料庫、文件資料庫等)中檢索相關的文件或資訊片段。 這個過程通常會使用向量嵌入(embedding)技術,將問題和知識庫中的文件轉換成向量,然後計算它們之間的相似度,找出最相關的內容。
  3. 資訊整合: 將檢索到的相關文件或資訊片段與原始提問一起整合,形成一個新的輸入prompt。這個prompt包含了問題本身以及支持回答問題的上下文資訊。
  4. 答案生成: 將整合後的prompt輸入到大型語言模型(LLM)中。LLM基於prompt中的所有資訊,生成最終的答案。
  5. 答案呈現: LLM 生成的答案會經過後處理,例如潤飾、格式化等,最終呈現給使用者。

簡單來說,RAG 就像是讓 LLM 在回答問題之前先「查閱資料」,確保答案的準確性和可靠性。

檢索增強生成的應用場景

  1. 客戶服務聊天機器人: 金融服務公司可以利用 RAG 技術,構建能夠回答客戶關於產品、服務和帳戶相關問題的聊天機器人。例如,國泰世華銀行的智能客服可以透過 RAG,快速檢索最新的利率、費用和條款,提供更精確的回答,提升客戶滿意度。
  2. 企業知識管理: 大型企業可以利用 RAG 技術,建立內部知識庫,讓員工能夠快速找到所需的資訊。例如,台積電可以將內部技術文件、會議記錄和最佳實踐等資料儲存在知識庫中,員工透過 RAG 系統,可以快速找到解決問題的方案,提升工作效率。
  3. 學術研究: 研究人員可以利用 RAG 技術,快速檢索相關的學術論文和研究報告,加速研究進程。例如,研究人員可以使用 RAG 系統,檢索過去 10 年關於特定疾病的研究論文,了解最新的研究進展和趨勢。
  4. 內容創作: 媒體公司可以利用 RAG 技術,輔助記者撰寫新聞報導和文章。例如,記者可以使用 RAG 系統,檢索相關的背景資料、事件時間線和專家評論,快速撰寫出更深入、更全面的報導。

檢索增強生成的重要性與限制

檢索增強生成的重要性在於它能夠顯著提升 LLM 的知識覆蓋範圍和答案準確性。傳統的 LLM 受限於訓練資料,只能回答訓練資料中包含的問題。而 RAG 讓 LLM 能夠利用外部知識,回答訓練資料中沒有的問題,並且提供更具體的資訊來源。

然而,RAG 也存在一些侷限性。首先,檢索的準確性直接影響答案的品質。如果檢索到的文件不相關或不準確,LLM 生成的答案也會受到影響。其次,RAG 系統的建置和維護需要一定的成本和技術能力,包括建立知識庫、訓練向量模型和優化檢索算法等。再者,RAG 並不能完全解決 LLM 的幻覺問題,如果 LLM 對檢索到的資訊理解錯誤,仍然可能生成不正確的答案。

檢索增強生成在 iPAS 考試中的重點

在 iPAS AI 應用規劃師考試中,檢索增強生成是一個重要的考點。考試可能會考察以下幾個方面:

  • RAG 的基本概念和原理: 考生需要理解 RAG 的定義、運作流程和優缺點。
  • RAG 的應用場景: 考生需要了解 RAG 在不同產業和領域的應用案例。
  • RAG 的技術細節: 考生需要了解 RAG 中使用的關鍵技術,例如向量嵌入、相似度計算和 LLM 的使用。
  • RAG 的評估指標: 考生需要了解如何評估 RAG 系統的性能,例如準確率、召回率和 F1 值。

考試方向可能包括:如何選擇合適的知識庫?如何設計有效的檢索策略?如何評估 RAG 系統的性能?如何將 RAG 應用於具體的業務場景?

常見問題

檢索增強生成和微調(Fine-tuning)有什麼不同?

特性 檢索增強生成 (RAG) 微調 (Fine-tuning)
知識來源 外部知識庫,即時檢索 模型的內部參數,訓練時學習
更新方式 易於更新,只需更新知識庫 需要重新訓練模型,成本較高
適用場景 需要處理大量、經常變動的資訊,例如客戶服務、知識管理 需要提升模型在特定任務上的表現,例如情感分析、文本分類

什麼時候應該使用檢索增強生成?

當你需要 LLM 回答涉及大量外部知識、需要最新資訊,或需要提供資訊來源的答案時,就應該考慮使用檢索增強生成。例如,當你需要 LLM 回答關於公司最新產品資訊、特定行業的法規變更,或需要提供參考文獻的學術問題時,RAG 是一個不錯的選擇。如果知識庫規模小,且變動頻率低,則可以考慮直接微調模型。

初學者學習檢索增強生成最常見的誤解是什麼?

初學者最常見的誤解是認為 RAG 可以完全取代 LLM 的訓練。RAG 只是增強 LLM 的知識,並不能改變 LLM 的基本能力。LLM 仍然需要經過訓練才能理解語言、生成文本和執行各種任務。RAG 的作用是讓 LLM 能夠利用外部知識,更好地完成這些任務。

iPAS 考試出題分析

根據歷年 iPAS AI 應用規劃師考古題統計,檢索增強生成 相關題目 平均佔 AI 技術類考題 8%, 屬於高頻考範圍。

常見出題方向包含:提示詞設計原則與框架(佔 45%)、RAG 與 AI 工具整合(佔 35%)、提示詞優化策略(佔 20%)。

相關術語

常見問題

檢索增強生成如何處理知識庫中的過時資訊?

RAG 系統需要定期更新知識庫,移除過時資訊並加入新的資訊。可以使用版本控制、時間戳記等技術來管理知識庫中的資訊。同時,在檢索時可以設定時間範圍,只檢索特定時間段內的資訊,避免使用過時的資訊。

檢索增強生成如何處理知識庫中的噪音資訊?

知識庫中的噪音資訊會影響檢索的準確性,進而影響答案的品質。可以使用資料清洗、資訊過濾等技術來減少噪音資訊。例如,可以移除重複的資訊、修正錯誤的資訊、過濾不相關的資訊等。此外,在檢索時可以使用更精確的檢索算法,減少噪音資訊的干擾。

檢索增強生成在處理多語言問題時會遇到什麼挑戰?

處理多語言問題時,需要考慮語言之間的差異。首先,需要將不同語言的提問和知識庫轉換成同一種語言,例如英文。可以使用機器翻譯等技術來實現語言轉換。其次,需要使用支持多語言的 LLM,確保 LLM 能夠理解不同語言的文本。最後,需要針對不同語言的特性,調整檢索算法和答案生成策略。

延伸學習

深入了解 檢索增強生成 的完整運作原理

延伸學習

想看 檢索增強生成 的完整影片教學?前往 美第奇 AI 學院

立即測驗

想測試你對 檢索增強生成 的掌握程度? 開始模擬考

資料來源與參考依據

本頁考試相關資訊依官方文件整理,實際考試內容以官方公告為準。