某團隊訓練深層神經網路模型時，發現訓練誤差長時間幾乎不下降，模型參數更新幅度極小，呈現學習停滯現象。若研判問題與梯度傳遞效率有關，下列何者最適合的改善策略？

Question

Accepted Answer

C. 調整模型中的啟動函數設定，以改善訓練過程的穩定性。訓練誤差不下降且參數更新幅度極小，與梯度傳遞效率有關，這是梯度消失問題的典型症狀。調整啟動函數（如從 Sigmoid 改為 ReLU）能有效改善梯度傳遞，解決梯度消失問題。

Answer

A. 延長模型訓練時間，使模型有更多機會調整參數

Answer

B. 增加訓練樣本數量，以提升模型學習能力

Answer

C. 調整模型中的啟動函數設定，以改善訓練過程的穩定性

Answer

D. 簡化模型結構，以降低模型過度擬合的可能性

iPAS 考題解析