一位資料分析師希望減少輸入特徵的維度,以提升模型運算效率,並觀察變數間潛在的整體結構關係。若欲保留最大資訊量、同時減少特徵數量,下列哪一項方法最適合?

iPAS 考題解析

一位資料分析師希望減少輸入特徵的維度,以提升模型運算效率,並觀察變數間潛在的整體結構關係。若欲保留最大資訊量、同時減少特徵數量,下列哪一項方法最適合?

  • A. 套用主成分分析(PCA)以擷取主要變異方向並轉換新變數; ✓ 正確答案
  • B. 利用離散化方法將連續變數轉為分類型欄位;
  • C. 使用標準化方法將所有特徵縮放至相同數值區間;
  • D. 以ETL技術移除空值欄位並改儲為JSON格式

詳細解析

主成分分析(Principal Component Analysis, PCA)透過擷取主要變異方向(Principal Components)來降維(Dimensionality Reduction),能保留最大資訊量同時減少特徵數量。

難度:★★☆