在時間序列模型的交叉驗證中,為何不能使用標準的 K-fold 交叉驗證?

iPAS 考題解析

在時間序列模型的交叉驗證中,為何不能使用標準的 K-fold 交叉驗證?

  • A. 時間序列資料太大,K-fold 計算成本太高
  • B. K-fold 需要資料常態分佈,時間序列通常不滿足
  • C. K-fold 只適用於分類問題,不適合時間序列迴歸
  • D. K-fold 會隨機打亂資料,破壞時序依賴性,導致「未來資訊洩漏」到訓練集 ✓ 正確答案

詳細解析

時間序列資料的核心特性是時序依賴性,未來的值不應出現在預測過去值的訓練資料中。K-fold 隨機打亂資料後,可能用「未來」資料預測「過去」,造成資訊洩漏(Data Leakage),高估模型真實性能。應使用時序切分法(Time Series Split/Walk-Forward Validation)。

出題年份:114 難度:★★☆