一間金融科技公司設計一款智慧投資系統,該系統會根據市場變化自動決定「買進」、「持有」或「賣出」的行動,並根據每次交易後的盈虧結果,逐步優化下一次的投資策略。整個過程中,系統不依賴事先標記的資料,而是根據歷次行動獲得的獎勵進行調整。請問此系統最可能採用哪一種學習方法?

iPAS 考題解析

一間金融科技公司設計一款智慧投資系統,該系統會根據市場變化自動決定「買進」、「持有」或「賣出」的行動,並根據每次交易後的盈虧結果,逐步優化下一次的投資策略。整個過程中,系統不依賴事先標記的資料,而是根據歷次行動獲得的獎勵進行調整。請問此系統最可能採用哪一種學習方法?

  • A. 強化式學習(Reinforcement Learning); ✓ 正確答案
  • B. 監督式學習(Supervised Learning);
  • C. 非監督式學習(Unsupervised Learning);
  • D. 遷移學習(Transfer Learning)

詳細解析

系統根據行動(買進/持有/賣出)獲得的獎勵(盈虧結果)逐步優化策略,不依賴標記資料,這完全符合強化式學習的特徵:Agent 與環境互動,透過獎勵訊號學習最優策略。

出題年份:114 難度:★★☆