在訓練模型時,若數據中出現特徵尺度差異極大(例如:年齡為 0–100、收入為 0–1,000,000),容易導致模型偏向特定特徵。為提升模型效能與穩定性,以下哪一種預處理方式最能有效解決此問題?
iPAS 考題解析
在訓練模型時,若數據中出現特徵尺度差異極大(例如:年齡為 0–100、收入為 0–1,000,000),容易導致模型偏向特定特徵。為提升模型效能與穩定性,以下哪一種預處理方式最能有效解決此問題?
- A. 移除尺度較小的欄位以避免對模型影響過低
- B. 對所有特徵進行 Z-score 標準化(Standardization) ✓ 正確答案
- C. 將特徵縮放至 0–1 區間進行最小-最大正規化(Min-Max Normalization)
- D. 對所有數值欄位加上常數使其不為零
詳細解析
Z-score 標準化將每個特徵轉換為均值 0、標準差 1,消除不同特徵尺度的差異,使模型不會因數值範圍大的特徵(如收入)而忽略範圍小的特徵(如年齡)。移除欄位會損失資訊;加常數不改變相對尺度;Min-Max Normalization(C)也可以但在有離群值時不如 Z-score 穩健。
出題年份:114 難度:★★☆