---
title: "注意力圖（Attention Map）"
slug: attention-map
language: zh-TW
source: https://aiterms.tw/terms/attention-map
updated_at: 2026-07-04
tags: [深度學習, 自然語言處理, 電腦視覺, 神經網路, source:ipas]
ipas_term: true
---

# 注意力圖（Attention Map）

注意力圖是注意力機制的內部權重視覺化表示，呈現模型在處理序列資料時，各個元素之間的相互關注程度與依賴關係。

## 完整說明

注意力圖是一種呈現神經網路內部注意力權重分佈的視覺化或結構化矩陣，能夠反映模型在處理資訊時對不同輸入元素的重視程度。常見應用包括自然語言處理中的機器翻譯對齊分析、電腦視覺中影像特徵重要性的視覺化，以及多模態模型中跨模態元素的關聯性分析。

## iPAS 考試出題分析

屬於未分類考範圍。

## 常見問題

### 什麼是多頭注意力機制中的注意力圖？

在多頭注意力機制中，模型不會只計算單一一個注意力圖。為了讓模型能夠從不同的特徵子空間捕捉輸入序列的多元關聯性，輸入向量會被分割或映射到多個不同的子空間（即所謂的頭）。每一個注意力頭都會獨立進行查詢、鍵、值的計算，並產生自己專屬的注意力圖。這些各自獨立的注意力圖能夠讓模型同時專注於不同的任務，例如在閱讀句子時，一個頭可能專注於文法時態，另一個頭可能專注於代名詞的指涉對象。最終，所有頭的輸出會被拼接並進行線性轉換，整合為全面的特徵表示。

### 為什麼觀察深層網路的注意力圖有時難以理解？

淺層網路的注意力圖通常處理的是原始輸入資料（如單字或影像區塊）之間的直接關聯，因此人類觀察者比較容易從直觀上理解其意義，例如相鄰單詞的依賴。然而，隨著網路層數的加深，輸入特徵經歷了多次的非線性轉換與注意力混合，其所代表的資訊已經變得高度抽象。深層網路中的元素不再是單純的字詞或像素，而是融合了全局上下文的複雜語意向量。因此，當我們觀察深層網路的注意力圖時，它反映的是這些高度抽象概念之間的互動，這已經超出了人類直覺所能輕易對應的具體事物，導致視覺化結果看似難以解釋。

### 注意力圖與顯著圖有什麼不同？

注意力圖與顯著圖雖然都是為了理解模型行為而採用的視覺化工具，但兩者的計算來源與代表意義有本質上的差異。注意力圖是注意力機制前向傳播過程中的內生變數，它是一個權重矩陣，反映了模型在構建內部特徵表示時，元素之間的資訊聚合比例。而顯著圖通常是透過反向傳播的梯度計算或其他事後歸因演算法得出的，它顯示的是針對某一個特定的最終預測結果（例如影像分類為特定物件），哪些輸入特徵提供了最大的貢獻或敏感度。簡而言之，注意力圖展示模型內部資訊如何交流，顯著圖展示哪些輸入決定了模型的最終輸出。

---

來源：https://aiterms.tw/terms/attention-map
快查頁：https://aiterms.tw/terms/attention-map
最後更新：2026/07/04
深度解說：https://aiterms.tw/learning/what-is-attention-map