在處理分類問題時,若某一類樣本數明顯少於其他類別,研究人員可能採用隨機過採樣(Random Oversampling)以平衡資料比例,此方法最常造成下列哪一種問題?
iPAS 考題解析
在處理分類問題時,若某一類樣本數明顯少於其他類別,研究人員可能採用隨機過採樣(Random Oversampling)以平衡資料比例,此方法最常造成下列哪一種問題?
- A. 增加過擬合風險 ✓ 正確答案
- B. 降低模型的收斂速度
- C. 減少資料總筆數數量
- D. 導致訓練資料欄位缺失
詳細解析
隨機過採樣是將少數類樣本重複複製,導致模型反覆看到相同的少數類樣本,容易記憶這些特定樣本而產生過擬合(Overfitting),在測試集或新資料上表現下降。
出題年份:114 難度:★★☆