梯度提升樹(GBT)使用 Label Encoding 時需注意什麼?
iPAS 考題解析
梯度提升樹(GBT)使用 Label Encoding 時需注意什麼?
- A. One-Hot Encoding 可以減少特徵相依性
- B. Label Encoding 可能使模型誤判類別間的順序關係 ✓ 正確答案
- C. Target Encoding 能自動消除過擬合
- D. PCA 降維後再編碼效果最好
詳細解析
GBT 會根據特徵值的大小來決定分裂點,如果無序類別被 Label Encoding 成 0, 1, 2,模型會把它當成有順序的連續值來切割,可能導致不合理的分裂。
難度:★★★