在訓練模型時,若數據中出現特徵尺度差異極大(例如:年齡為 0–100、收入為 0–1,000,000),容易導致模型偏向特定特徵。為提升模型效能與穩定性,以下哪一種預處理方式最能有效解決此問題?

iPAS 考題解析

在訓練模型時,若數據中出現特徵尺度差異極大(例如:年齡為 0–100、收入為 0–1,000,000),容易導致模型偏向特定特徵。為提升模型效能與穩定性,以下哪一種預處理方式最能有效解決此問題?

  • A. 移除尺度較小的欄位以避免對模型影響過低
  • B. 對所有特徵進行 Z-score 標準化(Standardization) ✓ 正確答案
  • C. 將特徵縮放至 0–1 區間進行最小-最大正規化(Min-Max Normalization)
  • D. 對所有數值欄位加上常數使其不為零

詳細解析

Z-score 標準化將每個特徵轉換為均值 0、標準差 1,消除不同特徵尺度的差異,使模型不會因數值範圍大的特徵(如收入)而忽略範圍小的特徵(如年齡)。移除欄位會損失資訊;加常數不改變相對尺度;Min-Max Normalization(C)也可以但在有離群值時不如 Z-score 穩健。

出題年份:114 難度:★★☆