什麼是 平均絕對誤差(Mean Absolute Error)?
平均絕對誤差(MAE)是衡量預測值與實際值之間平均絕對差異的指標,數值越小代表模型預測越準確。
核心概念
平均絕對誤差(Mean Absolute Error,MAE)是評估迴歸模型預測精度的重要指標。其核心概念圍繞著以下幾點:
- 絕對誤差: MAE 計算的是每個預測值與實際值之間的差的絕對值。絕對值確保所有誤差都為正數,避免正負誤差相互抵消。
- 平均值: MAE 將所有絕對誤差加總後,除以樣本總數,得到平均絕對誤差。這個平均值代表了模型預測的整體誤差水平。
- 一致性: MAE 的單位與原始資料的單位一致,這使得 MAE 的解釋更加直觀。例如,如果預測的是房價(單位:萬元),則 MAE 的單位也是萬元。
- 魯棒性: MAE 對於離群值(Outliers)具有一定的魯棒性,因為它使用絕對值,而不是平方值,來衡量誤差。這使得 MAE 不容易受到極端值的影響。
運作原理
MAE 的計算公式如下:
MAE = (1/n) * Σ |yᵢ - ŷᵢ|
其中:
n是樣本總數。yᵢ是第i個實際值。ŷᵢ是第i個預測值。Σ表示求和。| |表示絕對值。
計算步驟:
- 計算每個樣本的絕對誤差: 對於每個樣本,計算預測值與實際值之間的差的絕對值。
- 加總所有絕對誤差: 將所有樣本的絕對誤差加總起來。
- 計算平均值: 將絕對誤差的總和除以樣本總數,得到平均絕對誤差。
範例:
假設我們有一個包含 5 個樣本的資料集,其中實際值和預測值如下:
| 樣本 | 實際值 (yᵢ) | 預測值 (ŷᵢ) |
|---|---|---|
| 1 | 10 | 12 |
| 2 | 15 | 13 |
| 3 | 20 | 18 |
| 4 | 25 | 27 |
| 5 | 30 | 28 |
- 計算每個樣本的絕對誤差:
- |10 - 12| = 2
- |15 - 13| = 2
- |20 - 18| = 2
- |25 - 27| = 2
- |30 - 28| = 2
- 加總所有絕對誤差:
- 2 + 2 + 2 + 2 + 2 = 10
- 計算平均值:
- 10 / 5 = 2
因此,這個模型的 MAE 為 2。
實際應用
MAE 在迴歸模型的評估中被廣泛應用,例如:
- 房價預測: 評估房價預測模型的準確性。
- 銷售額預測: 評估銷售額預測模型的準確性。
- 股票價格預測: 評估股票價格預測模型的準確性。
- 天氣預報: 評估天氣預報模型的準確性。
- 需求預測: 評估需求預測模型的準確性。
MAE 也可以用於比較不同迴歸模型的性能。通常,MAE 越小的模型,其預測精度越高。
常見誤區
在使用 MAE 時,需要注意以下幾個常見誤區:
- MAE 無法提供誤差方向的信息: MAE 只衡量誤差的大小,而忽略了誤差的方向(正或負)。因此,MAE 無法區分模型是傾向於高估還是低估實際值。
- MAE 對所有誤差都給予相同的權重: MAE 對所有誤差都給予相同的權重,這意味著較大的誤差和較小的誤差對 MAE 的影響相同。在某些情況下,我們可能希望對較大的誤差給予更高的權重。
- MAE 不可微分: MAE 在零點處不可微分,這使得 MAE 在某些最佳化演算法中難以使用。例如,梯度下降法需要計算梯度,而 MAE 在零點處沒有梯度。
- MAE 的值取決於資料的尺度: MAE 的值取決於資料的尺度。例如,如果資料的單位是米,則 MAE 的值會比資料的單位是厘米時要小。因此,在比較不同資料集的 MAE 時,需要考慮資料的尺度。
MAE 與其他評估指標的比較:
- 均方誤差 (MSE): MSE 計算的是預測值與實際值之間差異的平方的平均數。MSE 對於離群值更加敏感,因為它使用平方值來衡量誤差。MSE 可微分,因此更容易在最佳化演算法中使用。
- 均方根誤差 (RMSE): RMSE 是 MSE 的平方根。RMSE 的單位與原始資料的單位一致,這使得 RMSE 的解釋更加直觀。RMSE 也對離群值更加敏感。
- R 平方 (R²): R² 衡量的是模型解釋資料變異的能力。R² 的值介於 0 和 1 之間,值越大表示模型解釋資料變異的能力越強。R² 不受資料尺度的影響。
總結:
MAE 是一種簡單易懂且常用的迴歸模型評估指標。它計算的是預測值與實際值之間差異的絕對值的平均數。MAE 對於離群值具有一定的魯棒性,但無法提供誤差方向的信息,且對所有誤差都給予相同的權重。在使用 MAE 時,需要注意其局限性,並結合其他評估指標一起使用,以更全面地評估模型的性能。
相關術語
常見問題
延伸學習
想看 平均絕對誤差 的完整影片教學?前往 美第奇 AI 學院