在進行資料前處理時,若使用Label Encoding將類別變數轉換為數字型態,下列何者為最常見的潛在風險?
iPAS 考題解析
在進行資料前處理時,若使用Label Encoding將類別變數轉換為數字型態,下列何者為最常見的潛在風險?
- A. 無法處理缺值
- B. 會引入類別之間的假序順關係 ✓ 正確答案
- C. 無法擴展至新資料
- D. 記憶體佔用過高
詳細解析
Label Encoding將類別映射為整數(如0、1、2),模型可能誤解這些整數具有大小或距離關係(如「類別2」>「類別1」),對無序名義變數會產生假序順關係,影響模型學習。
出題年份:114 難度:★★☆