一間金融科技公司設計一款智慧投資系統，該系統會根據市場變化自動決定「買進」、「持有」或「賣出」的行動，並根據每次交易後的盈虧結果，逐步優化下一次的投資策略。整個過程中，系統不依賴事先標記的資料，而是根據歷次行動獲得的獎勵進行調整。請問此系統最可能採用哪一種學習方法？

Question

Accepted Answer

A. 強化式學習（Reinforcement Learning）；。系統根據行動（買進/持有/賣出）獲得的獎勵（盈虧結果）逐步優化策略，不依賴標記資料，這完全符合強化式學習的特徵：Agent 與環境互動，透過獎勵訊號學習最優策略。

Answer

A. 強化式學習（Reinforcement Learning）；

Answer

B. 監督式學習（Supervised Learning）；

Answer

C. 非監督式學習（Unsupervised Learning）；

Answer

D. 遷移學習（Transfer Learning）

iPAS 考題解析