在進行模型訓練前,若針對資料中不同群體(例如分類標籤)之間樣本數量不平衡的情況進行比例調整,此方法通常屬於下列哪一種技術?

iPAS 考題解析

在進行模型訓練前,若針對資料中不同群體(例如分類標籤)之間樣本數量不平衡的情況進行比例調整,此方法通常屬於下列哪一種技術?

  • A. 資料重抽樣 ✓ 正確答案
  • B. 特徵選擇
  • C. 模型正則化
  • D. 超參數調整

詳細解析

資料重抽樣(Resampling)是解決類別不平衡的資料層面技術:包括過採樣(Oversampling,如 SMOTE 增加少數類樣本)和欠採樣(Undersampling,減少多數類樣本)。特徵選擇、正則化和超參數調整是模型訓練技術,不直接處理類別不平衡的比例問題。

出題年份:114 難度:★★☆