梯度提升樹(GBT)使用 Label Encoding 時需注意什麼?

iPAS 考題解析

梯度提升樹(GBT)使用 Label Encoding 時需注意什麼?

  • A. One-Hot Encoding 可以減少特徵相依性
  • B. Label Encoding 可能使模型誤判類別間的順序關係 ✓ 正確答案
  • C. Target Encoding 能自動消除過擬合
  • D. PCA 降維後再編碼效果最好

詳細解析

GBT 會根據特徵值的大小來決定分裂點,如果無序類別被 Label Encoding 成 0, 1, 2,模型會把它當成有順序的連續值來切割,可能導致不合理的分裂。

難度:★★★