在自然語言處理中,檢索增強生成(Retrieval-Augmented Generation, RAG)是一種結合語言模型與向量搜尋的技術,可有效減少模型知識過時與產生幻覺的問題。若要建立一套高效能的RAG系統,下列何者為在「檢索階段」最關鍵的挑戰?
iPAS 考題解析
在自然語言處理中,檢索增強生成(Retrieval-Augmented Generation, RAG)是一種結合語言模型與向量搜尋的技術,可有效減少模型知識過時與產生幻覺的問題。若要建立一套高效能的RAG系統,下列何者為在「檢索階段」最關鍵的挑戰?
- A. 確保檢索到的文件能被完整納入語言模型的上下文視窗(Context Window)中進行生成
- B. 選擇使用Faiss或ScaNN等近似最近鄰搜尋函式庫
- C. 降低嵌入模型(Embedding Model)在高維空間中的計算成本與記憶體占用
- D. 避免向量檢索結果僅具語意相似但與查詢意圖無實質關聯的情況 ✓ 正確答案
詳細解析
在RAG的檢索階段,最核心的挑戰是確保檢索到的文件不只是向量空間上語意相似,更要與使用者的實際查詢意圖高度相關。語意相似但意圖不符的結果會導致生成內容偏離,即所謂的「相關但無用」問題。
出題年份:114 難度:★★☆