某金融科技公司建立房價預測模型,使用多項特徵(如建坪、房齡、樓層、總價等)進行線性迴歸分析(Linear Regression Analysis)。資料分析師發現多個特徵之間存在高度相關性,導致模型係數不穩定、預測誤差上升。為解決此問題,下列哪一種方法最適合?

iPAS 考題解析

某金融科技公司建立房價預測模型,使用多項特徵(如建坪、房齡、樓層、總價等)進行線性迴歸分析(Linear Regression Analysis)。資料分析師發現多個特徵之間存在高度相關性,導致模型係數不穩定、預測誤差上升。為解決此問題,下列哪一種方法最適合?

  • A. 繼續保留所有特徵,不進行任何處理
  • B. 使用主成份分析(PCA)將相關特徵轉換為彼此獨立的主成分 ✓ 正確答案
  • C. 新增更多原始變數以提升模型表現
  • D. 改用分類模型進行預測

詳細解析

PCA可將高度相關的特徵轉換為彼此正交(不相關)的主成分,消除多重共線性問題,從而使線性迴歸模型的係數估計更穩定,提升預測準確性。

出題年份:114 難度:★★☆