在一個同時包含連續型特徵與類別型特徵的資料集中,若希望透過適當的特徵工程流程來提升模型整體表現,下列哪一種作法最為合適?

iPAS 考題解析

在一個同時包含連續型特徵與類別型特徵的資料集中,若希望透過適當的特徵工程流程來提升模型整體表現,下列哪一種作法最為合適?

  • A. 將類別型特徵使用標籤編碼(Label Encoding)轉換後,與連續特徵直接合併進行模型訓練
  • B. 將連續特徵進行離散化(Discretization)或分桶(Binning)轉為類別型特徵,統一以類別方式處理
  • C. 對連續特徵做標準化(Standardization),類別特徵採用目標編碼(Target Encoding),並生成交互特徵提升模型表現 ✓ 正確答案
  • D. 只保留連續特徵,忽略類別型變量以簡化模型

詳細解析

針對不同類型特徵採用適當的處理策略(連續特徵標準化、類別特徵目標編碼),並生成交互特徵捕捉跨特徵的非線性關係,是全面且有效提升模型表現的特徵工程最佳實踐。

出題年份:114 難度:★★☆