同時包含連續型和類別型特徵時,最佳的特徵工程方法為何?

iPAS 考題解析

同時包含連續型和類別型特徵時,最佳的特徵工程方法為何?

  • A. 全部用 Label Encoding 再合併
  • B. 將連續特徵離散化
  • C. 連續特徵標準化 + 類別特徵目標編碼 + 交互特徵 ✓ 正確答案
  • D. 只保留連續型特徵

詳細解析

不同類型的特徵需要不同的處理:連續特徵做標準化(Standardization)(消除量級差異),類別特徵用目標編碼(保留與目標變數的關係),再建立交互特徵(捕捉特徵之間的組合效應)。

難度:★★★