# 機制性可解釋性（Mechanistic Interpretability）

機制性可解釋性旨在理解AI模型內部運作的具體機制，如同理解程式碼般，而非僅僅觀察輸入輸出關係。

## 完整說明

機制性可解釋性是一種AI研究方向，目標是理解AI模型內部如何做出決策，不僅僅是觀察輸入和輸出之間的關係，而是深入了解模型內部神經元、權重和激活函數等組件如何協同工作，最終產生特定的結果。它試圖將模型的行為分解為更小的、可理解的組件，並理解這些組件如何相互作用。

## 常見問題

### undefined



### undefined



### undefined



---

來源：https://aiterms.tw/terms/mechanistic-interpretability
快查頁：https://aiterms.tw/terms/mechanistic-interpretability
深度解說：https://aiterms.tw/learning/what-is-mechanistic-interpretability