自動調整學習率且特別適用於稀疏資料的優化器為何?
iPAS 考題解析
自動調整學習率且特別適用於稀疏資料的優化器為何?
- A. Momentum
- B. Adagrad ✓ 正確答案
- C. Adam
- D. SGD
詳細解析
Adagrad 對每個參數維護獨立的學習率(Learning Rate),頻繁更新的參數學習率自動降低,罕見參數的學習率保持較高。特別適合稀疏資料(如 NLP 中的詞向量)。
難度:★★★
自動調整學習率且特別適用於稀疏資料的優化器為何?
自動調整學習率且特別適用於稀疏資料的優化器為何?
Adagrad 對每個參數維護獨立的學習率(Learning Rate),頻繁更新的參數學習率自動降低,罕見參數的學習率保持較高。特別適合稀疏資料(如 NLP 中的詞向量)。