下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題?

iPAS 考題解析

下列何者最適合訓練電腦下圍棋、自動駕駛等動態重複地互動的問題?

  • A. 監督式學習(Supervised Learning)
  • B. 非監督式學習(Unsupervised Learning)
  • C. 半監督式學習(Semi-supervised Learning)
  • D. 強化學習(Reinforcement Learning) ✓ 正確答案

詳細解析

下圍棋、自動駕駛等需要在動態環境中重複互動並從獎勵(Reward)中學習的問題,最適合強化學習(Reinforcement Learning)。

難度:★★☆