下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題?
iPAS 考題解析
下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題?
- A. 監督式學習(Supervised Learning)
- B. 非監督式學習(Unsupervised Learning)
- C. 半監督式學習(Semi-supervised Learning)
- D. 強化學習(Reinforcement Learning) ✓ 正確答案
詳細解析
下圍棋、自動駕駛等需要在動態環境中重複互動並從獎勵(Reward)中學習的問題,最適合強化學習(Reinforcement Learning)。
難度:★★☆