低資源語言模型出現過擬合,但不能新增語料,應如何改善?
iPAS 考題解析
低資源語言模型出現過擬合,但不能新增語料,應如何改善?
- A. 擴增隱藏層數量
- B. 使用 Back-Translation 生成偽平行語料 ✓ 正確答案
- C. 加入 L1 正則化
- D. 凍結 mBERT 的所有層
詳細解析
Back-Translation 是把目標語言翻譯回來再翻譯過去,產生「偽平行語料」來增加訓練資料量。這不是新增真實語料,而是用現有資料生成更多變體。
難度:★★★
低資源語言模型出現過擬合,但不能新增語料,應如何改善?
低資源語言模型出現過擬合,但不能新增語料,應如何改善?
Back-Translation 是把目標語言翻譯回來再翻譯過去,產生「偽平行語料」來增加訓練資料量。這不是新增真實語料,而是用現有資料生成更多變體。