---
title: "最大平均差異（Maximum Mean Discrepancy）"
slug: maximum-mean-discrepancy
language: zh-TW
source: https://aiterms.tw/terms/maximum-mean-discrepancy
updated_at: 2026-07-04
tags: [機器學習, 模型評估, 統計方法, 最佳化, source:ipas]
ipas_term: true
---

# 最大平均差異（Maximum Mean Discrepancy）

一種衡量兩個機率分佈之間差異的統計距離，常用於生成模型評估與領域適應。

## 完整說明

最大平均差異是一種非參數統計距離度量，用於量化兩個機率分佈在特定特徵空間中的差異。它能夠有效比較高維資料分佈，常用於評估生成模型品質、執行領域適應以及進行雙樣本檢定。

## iPAS 考試出題分析

屬於未分類考範圍。

## 常見問題

### MMD與KL散度有何不同？

MMD與KL散度在衡量分佈差異上有本質區別。MMD是一種非參數方法，它將分佈映射到再生核希爾伯特空間中，透過比較其平均嵌入的距離來衡量差異，無需顯式估計分佈的機率密度函數，對高維資料更具魯棒性且是對稱的。而KL散度則是一種基於資訊理論的方法，它要求顯式地估計兩個分佈的機率密度函數，這在高維空間中通常非常困難且不準確。KL散度是不對稱的，且當一個分佈在另一個分佈為零的區域有密度時，其值可能為無窮大，這在某些情況下會導致不穩定的行為。

### 如何選擇MMD的核函數？

MMD的效能對核函數的選擇及其參數（如高斯核的帶寬）非常敏感。選擇合適的核函數是關鍵。對於大多數連續資料，高斯核（RBF核）是一個常見且有效的選擇，但其帶寬參數需要仔細調整。一種常見的啟發式方法是使用中位數法則（median heuristic），即將帶寬設定為所有樣本對之間距離的中位數。此外，也可以透過交叉驗證或網格搜索等方法來尋找最佳的核參數。對於不同類型的資料（如離散資料或圖資料），可能需要選擇特定的核函數，例如多項式核或圖核。在某些情況下，也可以使用多核學習（Multiple Kernel Learning）來組合多個核函數，以獲得更好的表現。

### MMD在生成對抗網路（GAN）中有何應用？

MMD在生成對抗網路（GAN）中主要有兩個應用方向。首先，它可以作為一種評估指標，用來量化GAN生成的樣本分佈與真實資料分佈之間的相似度。較小的MMD值表示生成器能夠更好地複製真實資料的特徵。其次，MMD也可以作為GAN的損失函數或正則化項。在MMD-GAN中，生成器和判別器被訓練來最小化MMD值，而非傳統的對抗損失。這種方法可以避免模式崩潰（mode collapse）問題，因為MMD能夠有效捕捉分佈的整體差異，鼓勵生成器覆蓋真實資料分佈的所有模式。此外，MMD的平滑性也可能提供更好的梯度性質，有助於訓練的穩定性。

---

來源：https://aiterms.tw/terms/maximum-mean-discrepancy
快查頁：https://aiterms.tw/terms/maximum-mean-discrepancy
最後更新：2026/07/04
深度解說：https://aiterms.tw/learning/what-is-maximum-mean-discrepancy