某企業在訓練生成式AI模型時,導入資料增強(Data Augmentation)技術以擴充訓練資料,但觀察到模型效能反而下降。下列哪一項最可能的原因與對應改善策略最為正確?

iPAS 考題解析

某企業在訓練生成式AI模型時,導入資料增強(Data Augmentation)技術以擴充訓練資料,但觀察到模型效能反而下降。下列哪一項最可能的原因與對應改善策略最為正確?

  • A. 增強樣本未經隨機初始化,導致模型梯度更新不穩定,應重新設計訓練啟動流程
  • B. 增強後資料的特徵分佈與原始資料不一致,影響模型的泛化能力,應檢查並調整增強策略以維持語意一致性 ✓ 正確答案
  • C. 增強樣本的比例過高,造成模型對特定資料產生偏好,應適度提高增強比例並調整學習率
  • D. 增強後資料的標註可信度下降,導致訓練訊號偏差,應以半監督學習方式重新校正資料

詳細解析

若資料增強策略(如文本替換或影像變換)改變了樣本的語意或特徵分佈,增強後的資料可能引入噪聲或誤導性模式,使模型學習到錯誤的特徵,反而降低效能。解決方案是確保增強後的樣本仍保持語意一致性。

出題年份:114 難度:★★☆