低資源語言模型出現過擬合,但不能新增語料,應如何改善?

iPAS 考題解析

低資源語言模型出現過擬合,但不能新增語料,應如何改善?

  • A. 擴增隱藏層數量
  • B. 使用 Back-Translation 生成偽平行語料 ✓ 正確答案
  • C. 加入 L1 正則化
  • D. 凍結 mBERT 的所有層

詳細解析

Back-Translation 是把目標語言翻譯回來再翻譯過去,產生「偽平行語料」來增加訓練資料量。這不是新增真實語料,而是用現有資料生成更多變體。

難度:★★★