在進行資料前處理時,若使用Label Encoding將類別變數轉換為數字型態,下列何者為最常見的潛在風險?

iPAS 考題解析

在進行資料前處理時,若使用Label Encoding將類別變數轉換為數字型態,下列何者為最常見的潛在風險?

  • A. 無法處理缺值
  • B. 會引入類別之間的假序順關係 ✓ 正確答案
  • C. 無法擴展至新資料
  • D. 記憶體佔用過高

詳細解析

Label Encoding將類別映射為整數(如0、1、2),模型可能誤解這些整數具有大小或距離關係(如「類別2」>「類別1」),對無序名義變數會產生假序順關係,影響模型學習。

出題年份:114 難度:★★☆