自動調整學習率且特別適用於稀疏資料的優化器為何?

iPAS 考題解析

自動調整學習率且特別適用於稀疏資料的優化器為何?

  • A. Momentum
  • B. Adagrad ✓ 正確答案
  • C. Adam
  • D. SGD

詳細解析

Adagrad 對每個參數維護獨立的學習率(Learning Rate),頻繁更新的參數學習率自動降低,罕見參數的學習率保持較高。特別適合稀疏資料(如 NLP 中的詞向量)。

難度:★★★