檢索增強生成（Retrieval-Augmented Generation）｜AI 術語定義

一句話理解

RAG 就像開卷考試 -- AI 回答問題前先查資料庫找到相關內容，再根據找到的資料生成答案，而不是完全靠記憶回答

容易混淆

vs 純 LLM 生成：純 LLM 像閉卷考（靠記憶，容易瞎編），RAG 像開卷考（有參考資料，更準確）。vs 微調：微調改變模型本身，RAG 不改模型，只是在回答前提供參考資料

關鍵因果

因為 LLM 容易產生幻覺（編造不存在的資訊），而且訓練資料有時效性，所以 RAG 被發明來讓 AI 能引用最新且真實的資料來回答

完整說明

檢索增強生成是什麼？

檢索增強生成（Retrieval-Augmented Generation，RAG）是一種結合了資訊檢索與大型語言模型（LLM）的 AI 技術。它先從外部知識庫中檢索與使用者提問相關的文件，然後將檢索到的文件連同原始問題一起輸入 LLM，讓 LLM 基於這些資訊生成更準確、更具參考價值的答案。這種方法讓 LLM 能夠利用外部知識，克服自身知識的侷限性，尤其是在需要處理特定領域或最新資訊的任務中，RAG 展現了強大的優勢。

檢索增強生成的運作原理

檢索增強生成的核心機制可以分為以下幾個步驟：

問題理解： 首先，系統接收使用者的提問，並對提問進行語義分析，理解使用者的意圖。
資訊檢索： 根據理解後的提問，系統從預先建立的知識庫（例如向量資料庫、文件資料庫等）中檢索相關的文件或資訊片段。這個過程通常會使用向量嵌入（embedding）技術，將問題和知識庫中的文件轉換成向量，然後計算它們之間的相似度，找出最相關的內容。
資訊整合： 將檢索到的相關文件或資訊片段與原始提問一起整合，形成一個新的輸入prompt。這個prompt包含了問題本身以及支持回答問題的上下文資訊。
答案生成： 將整合後的prompt輸入到大型語言模型（LLM）中。LLM基於prompt中的所有資訊，生成最終的答案。
答案呈現： LLM 生成的答案會經過後處理，例如潤飾、格式化等，最終呈現給使用者。

簡單來說，RAG 就像是讓 LLM 在回答問題之前先「查閱資料」，確保答案的準確性和可靠性。

檢索增強生成的應用場景

客戶服務聊天機器人： 金融服務公司可以利用 RAG 技術，構建能夠回答客戶關於產品、服務和帳戶相關問題的聊天機器人。例如，國泰世華銀行的智能客服可以透過 RAG，快速檢索最新的利率、費用和條款，提供更精確的回答，提升客戶滿意度。
企業知識管理： 大型企業可以利用 RAG 技術，建立內部知識庫，讓員工能夠快速找到所需的資訊。例如，台積電可以將內部技術文件、會議記錄和最佳實踐等資料儲存在知識庫中，員工透過 RAG 系統，可以快速找到解決問題的方案，提升工作效率。
學術研究： 研究人員可以利用 RAG 技術，快速檢索相關的學術論文和研究報告，加速研究進程。例如，研究人員可以使用 RAG 系統，檢索過去 10 年關於特定疾病的研究論文，了解最新的研究進展和趨勢。
內容創作： 媒體公司可以利用 RAG 技術，輔助記者撰寫新聞報導和文章。例如，記者可以使用 RAG 系統，檢索相關的背景資料、事件時間線和專家評論，快速撰寫出更深入、更全面的報導。

檢索增強生成的重要性與限制

檢索增強生成的重要性在於它能夠顯著提升 LLM 的知識覆蓋範圍和答案準確性。傳統的 LLM 受限於訓練資料，只能回答訓練資料中包含的問題。而 RAG 讓 LLM 能夠利用外部知識，回答訓練資料中沒有的問題，並且提供更具體的資訊來源。

然而，RAG 也存在一些侷限性。首先，檢索的準確性直接影響答案的品質。如果檢索到的文件不相關或不準確，LLM 生成的答案也會受到影響。其次，RAG 系統的建置和維護需要一定的成本和技術能力，包括建立知識庫、訓練向量模型和優化檢索算法等。再者，RAG 並不能完全解決 LLM 的幻覺問題，如果 LLM 對檢索到的資訊理解錯誤，仍然可能生成不正確的答案。

檢索增強生成在 iPAS 考試中的重點

在 iPAS AI 應用規劃師考試中，檢索增強生成是一個重要的考點。考試可能會考察以下幾個方面：

RAG 的基本概念和原理： 考生需要理解 RAG 的定義、運作流程和優缺點。
RAG 的應用場景： 考生需要了解 RAG 在不同產業和領域的應用案例。
RAG 的技術細節： 考生需要了解 RAG 中使用的關鍵技術，例如向量嵌入、相似度計算和 LLM 的使用。
RAG 的評估指標： 考生需要了解如何評估 RAG 系統的性能，例如準確率、召回率和 F1 值。

考試方向可能包括：如何選擇合適的知識庫？如何設計有效的檢索策略？如何評估 RAG 系統的性能？如何將 RAG 應用於具體的業務場景？

常見問題

檢索增強生成和微調（Fine-tuning）有什麼不同？

特性	檢索增強生成 (RAG)	微調 (Fine-tuning)
知識來源	外部知識庫，即時檢索	模型的內部參數，訓練時學習
更新方式	易於更新，只需更新知識庫	需要重新訓練模型，成本較高
適用場景	需要處理大量、經常變動的資訊，例如客戶服務、知識管理	需要提升模型在特定任務上的表現，例如情感分析、文本分類

什麼時候應該使用檢索增強生成？

當你需要 LLM 回答涉及大量外部知識、需要最新資訊，或需要提供資訊來源的答案時，就應該考慮使用檢索增強生成。例如，當你需要 LLM 回答關於公司最新產品資訊、特定行業的法規變更，或需要提供參考文獻的學術問題時，RAG 是一個不錯的選擇。如果知識庫規模小，且變動頻率低，則可以考慮直接微調模型。

初學者學習檢索增強生成最常見的誤解是什麼？

初學者最常見的誤解是認為 RAG 可以完全取代 LLM 的訓練。RAG 只是增強 LLM 的知識，並不能改變 LLM 的基本能力。LLM 仍然需要經過訓練才能理解語言、生成文本和執行各種任務。RAG 的作用是讓 LLM 能夠利用外部知識，更好地完成這些任務。

iPAS 考試出題分析

根據歷年 iPAS AI 應用規劃師考古題統計，檢索增強生成相關題目平均佔 AI 技術類考題 8%，屬於高頻考範圍。

常見出題方向包含：提示詞設計原則與框架（佔 45%）、RAG 與 AI 工具整合（佔 35%）、提示詞優化策略（佔 20%）。

檢索增強生成如何處理知識庫中的過時資訊？

RAG 系統需要定期更新知識庫，移除過時資訊並加入新的資訊。可以使用版本控制、時間戳記等技術來管理知識庫中的資訊。同時，在檢索時可以設定時間範圍，只檢索特定時間段內的資訊，避免使用過時的資訊。

檢索增強生成如何處理知識庫中的噪音資訊？

知識庫中的噪音資訊會影響檢索的準確性，進而影響答案的品質。可以使用資料清洗、資訊過濾等技術來減少噪音資訊。例如，可以移除重複的資訊、修正錯誤的資訊、過濾不相關的資訊等。此外，在檢索時可以使用更精確的檢索算法，減少噪音資訊的干擾。

檢索增強生成在處理多語言問題時會遇到什麼挑戰？

處理多語言問題時，需要考慮語言之間的差異。首先，需要將不同語言的提問和知識庫轉換成同一種語言，例如英文。可以使用機器翻譯等技術來實現語言轉換。其次，需要使用支持多語言的 LLM，確保 LLM 能夠理解不同語言的文本。最後，需要針對不同語言的特性，調整檢索算法和答案生成策略。

延伸學習

深入了解檢索增強生成的完整運作原理

延伸學習

想看檢索增強生成的完整影片教學？前往美第奇 AI 學院

立即測驗

想測試你對檢索增強生成的掌握程度？開始模擬考

檢索增強生成（Retrieval-Augmented Generation）

一句話理解

容易混淆

關鍵因果

完整說明

檢索增強生成是什麼？

檢索增強生成的運作原理

檢索增強生成的應用場景

檢索增強生成的重要性與限制

檢索增強生成在 iPAS 考試中的重點

常見問題

檢索增強生成和微調（Fine-tuning）有什麼不同？

什麼時候應該使用檢索增強生成？

初學者學習檢索增強生成最常見的誤解是什麼？

iPAS 考試出題分析

相關術語

相關術語

常見問題

檢索增強生成如何處理知識庫中的過時資訊？

檢索增強生成如何處理知識庫中的噪音資訊？

檢索增強生成在處理多語言問題時會遇到什麼挑戰？

延伸學習

立即測驗

資料來源與參考依據