一家旅遊平台希望建立模型,預測顧客下次是否會再次透過該平台訂房。資料包含:顧客 ID、年齡、旅遊次數、平均花費金額、主要交通方式(火車/飛機/自駕/公車)、會員等級(普通/進階/白金)、是否為海外旅遊等。下列哪一種特徵工程方法最適合處理「主要交通方式」欄位?

iPAS 考題解析

一家旅遊平台希望建立模型,預測顧客下次是否會再次透過該平台訂房。資料包含:顧客 ID、年齡、旅遊次數、平均花費金額、主要交通方式(火車/飛機/自駕/公車)、會員等級(普通/進階/白金)、是否為海外旅遊等。下列哪一種特徵工程方法最適合處理「主要交通方式」欄位?

  • A. 布林轉換(Boolean Conversion);
  • B. 序數編碼(Ordinal Encoding);
  • C. 數值標準化(Numerical Standardization);
  • D. One-hot 編碼(One-hot Encoding) ✓ 正確答案

詳細解析

「主要交通方式」是名義型類別變數(火車/飛機/自駕/公車),各類別之間沒有順序或大小關係。One-hot 編碼將每個類別轉為獨立的二元欄位,避免模型誤認類別之間存在數值大小關係。

出題年份:114 難度:★★☆