在進行超參數調校(Hyperparameter Tuning)時,若直接在K-Fold交叉驗證(Cross-Validation)的資料上同時調整模型參數並評估效能,最可能導致下列哪一種問題?
iPAS 考題解析
在進行超參數調校(Hyperparameter Tuning)時,若直接在K-Fold交叉驗證(Cross-Validation)的資料上同時調整模型參數並評估效能,最可能導致下列哪一種問題?
- A. 模型的交叉驗證結果出現過度樂觀偏差(Over-optimistic Bias),因測試摺資料間接參與參數選擇,造成資料洩漏(Data Leakage) ✓ 正確答案
- B. 模型會在每一摺(Fold)內反覆調整參數,導致訓練不穩與過度正則化
- C. 因交叉驗證資料被重複使用,造成效能方差增大,無法獲得穩定估計
- D. K-Fold交叉驗證的假設與超參數搜尋相衝突,導致驗證過程失效
詳細解析
若用同一組K-Fold資料同時進行超參數調整和效能評估,驗證集實際上間接參與了模型選擇過程,造成資料洩漏,使評估結果過度樂觀。正確做法應採用巢狀交叉驗證(Nested Cross-Validation)或留出獨立測試集。
出題年份:114 難度:★★☆