---
title: "機器閱讀理解（Machine Reading Comprehension）"
slug: machine-reading-comprehension
language: zh-TW
source: https://aiterms.tw/terms/machine-reading-comprehension
updated_at: 2026-07-04
tags: [自然語言處理, 深度學習, AI應用, source:arxiv]
ipas_term: false
---

# 機器閱讀理解（Machine Reading Comprehension）

讓電腦系統具備閱讀人類語言文本並回答相關問題能力的自然語言處理技術。

## 完整說明

機器閱讀理解是一種讓電腦系統自動分析非結構化文本並回答相關問題的技術，用於從海量文件中快速擷取精確資訊。常見應用包括智慧客服、醫療文獻檢索、法律合約審閱及企業內部知識管理系統。

## 常見問題

### 機器閱讀理解在企業導入時，需要準備哪些基礎設施與資料？

企業導入機器閱讀理解技術時，首先需要準備高品質的領域知識庫。這包括將企業內部的非結構化文件，如產品手冊、技術規範或客戶服務紀錄，進行清理與數位化整理。這些文本資料必須力求語意清晰且格式統一。在基礎設施方面，由於訓練和運行語言模型需要龐大的運算資源，企業需要建置具備高效能運算能力的伺服器環境，或者選擇租用雲端平台的運算節點。此外，為了讓模型能夠理解企業專屬的專業術語，技術團隊需要準備一定數量的「問題與答案」配對數據，用於對預訓練模型進行微調。建立持續收集使用者反饋的機制也是必要的，這能幫助系統在實際上線後不斷修正錯誤，逐步提升閱讀與理解的準確度。

### 目前的機器閱讀理解技術在處理長篇文本時會遇到什麼挑戰？

當前機器閱讀理解系統在處理長篇文本時面臨幾個主要挑戰。首先是硬體資源的限制。主流的架構在處理長度極長的文本時，計算量和記憶體消耗會急遽增加，這限制了模型一次能閱讀的文本長度。其次是注意力分散的問題。當輸入文本包含過多無關的干擾資訊時，模型容易迷失焦點，無法準確定位到包含答案的關鍵段落。此外，長篇文本往往涉及複雜的跨段落邏輯推理和多個實體之間的指代關係，模型需要具備強大的長距離依賴捕捉能力，才能整合散落於不同章節的資訊。為了解決這些問題，研究人員正在積極探索更高效的架構設計，或是採用先進行文本分塊檢索、再進行局部閱讀理解的兩階段處理方式。

### 抽取式閱讀理解與生成式閱讀理解在應用場景上有何不同？

抽取式閱讀理解與生成式閱讀理解在設計理念與應用場景上有顯著差異。抽取式系統的運作方式是直接從原文中擷取一段連續的字串作為答案。這種做法的優勢在於答案具有明確的來源依據，可解釋性高，適用於對準確度要求嚴格、且答案本身就存在於文本中的場景，如法律合約的條款提取或醫療記錄的症狀標記。相對地，生成式系統則是理解文本後，用自己的詞彙組織並輸出答案。它能夠整合多個段落的資訊，生成更流暢、更符合人類對話習慣的回應。這種特性使得生成式閱讀理解非常適合應用於智慧客服對話、複雜概念的簡化解釋，以及需要跨文件統整資訊的開放式問答系統中。

---

來源：https://aiterms.tw/terms/machine-reading-comprehension
快查頁：https://aiterms.tw/terms/machine-reading-comprehension
最後更新：2026/07/04
深度解說：https://aiterms.tw/learning/what-is-machine-reading-comprehension