什麼是 強化學習(Reinforcement Learning)? 透過和環境互動,做對了加分做錯了扣分,自己摸索出最佳策略 類比:像訓練寵物——做對給零食獎勵,做錯不理牠,牠慢慢學會什麼行為會得到獎賞 ← 回到 強化學習 快查頁 延伸學習 想看 強化學習 的完整影片教學?前往 美第奇 AI 學院