在自然語言處理中,檢索增強生成(Retrieval-Augmented Generation, RAG)是一種結合語言模型與向量搜尋的技術,可有效減少模型知識過時與產生幻覺的問題。若要建立一套高效能的RAG系統,下列何者為在「檢索階段」最關鍵的挑戰?

iPAS 考題解析

在自然語言處理中,檢索增強生成(Retrieval-Augmented Generation, RAG)是一種結合語言模型與向量搜尋的技術,可有效減少模型知識過時與產生幻覺的問題。若要建立一套高效能的RAG系統,下列何者為在「檢索階段」最關鍵的挑戰?

  • A. 確保檢索到的文件能被完整納入語言模型的上下文視窗(Context Window)中進行生成
  • B. 選擇使用Faiss或ScaNN等近似最近鄰搜尋函式庫
  • C. 降低嵌入模型(Embedding Model)在高維空間中的計算成本與記憶體占用
  • D. 避免向量檢索結果僅具語意相似但與查詢意圖無實質關聯的情況 ✓ 正確答案

詳細解析

在RAG的檢索階段,最核心的挑戰是確保檢索到的文件不只是向量空間上語意相似,更要與使用者的實際查詢意圖高度相關。語意相似但意圖不符的結果會導致生成內容偏離,即所謂的「相關但無用」問題。

出題年份:114 難度:★★☆