同時包含連續型和類別型特徵時,最佳的特徵工程方法為何?
iPAS 考題解析
同時包含連續型和類別型特徵時,最佳的特徵工程方法為何?
- A. 全部用 Label Encoding 再合併
- B. 將連續特徵離散化
- C. 連續特徵標準化 + 類別特徵目標編碼 + 交互特徵 ✓ 正確答案
- D. 只保留連續型特徵
詳細解析
不同類型的特徵需要不同的處理:連續特徵做標準化(Standardization)(消除量級差異),類別特徵用目標編碼(保留與目標變數的關係),再建立交互特徵(捕捉特徵之間的組合效應)。
難度:★★★