在深度神經網路訓練中,「學習率(Learning Rate)」是一個關鍵超參數,下列哪項描述最為準確?
iPAS 考題解析
在深度神經網路訓練中,「學習率(Learning Rate)」是一個關鍵超參數,下列哪項描述最為準確?
- A. 學習率越大,模型一定收斂得越快且效果越好
- B. 學習率越小,梯度更新越穩定,但訓練速度越慢
- C. 學習率需要精心調整:過大導致震盪,過小導致收斂緩慢甚至陷入局部最小值 ✓ 正確答案
- D. 學習率只影響訓練速度,不影響最終模型性能
詳細解析
學習率是控制梯度更新步幅的關鍵超參數。學習率過大會使損失函數震盪甚至發散;學習率過小則收斂速度極慢,且可能陷入局部最小值。實際訓練中常用學習率排程(如餘弦退火、warmup)動態調整。
出題年份:114 難度:★★☆