某團隊訓練深層神經網路模型時,發現訓練誤差長時間幾乎不下降,模型參數更新幅度極小,呈現學習停滯現象。若研判問題與梯度傳遞效率有關,下列何者最適合的改善策略?
iPAS 考題解析
某團隊訓練深層神經網路模型時,發現訓練誤差長時間幾乎不下降,模型參數更新幅度極小,呈現學習停滯現象。若研判問題與梯度傳遞效率有關,下列何者最適合的改善策略?
- A. 延長模型訓練時間,使模型有更多機會調整參數
- B. 增加訓練樣本數量,以提升模型學習能力
- C. 調整模型中的啟動函數設定,以改善訓練過程的穩定性 ✓ 正確答案
- D. 簡化模型結構,以降低模型過度擬合的可能性
詳細解析
訓練誤差不下降且參數更新幅度極小,與梯度傳遞效率有關,這是梯度消失問題的典型症狀。調整啟動函數(如從 Sigmoid 改為 ReLU)能有效改善梯度傳遞,解決梯度消失問題。
出題年份:115 難度:★★☆