一家旅遊平台希望建立模型,預測顧客下次是否會再次透過該平台訂房。資料包含:顧客ID、年齡、旅遊次數、平均花費金額、主要交通方式(火車/飛機/自駕/公車)、會員等級(普通/進階/白金)、是否為海外旅遊等。下列哪一種特徵工程方法最適合處理「主要交通方式」欄位?

iPAS 考題解析

一家旅遊平台希望建立模型,預測顧客下次是否會再次透過該平台訂房。資料包含:顧客ID、年齡、旅遊次數、平均花費金額、主要交通方式(火車/飛機/自駕/公車)、會員等級(普通/進階/白金)、是否為海外旅遊等。下列哪一種特徵工程方法最適合處理「主要交通方式」欄位?

  • A. 布林轉換(Boolean Conversion);
  • B. 序數編碼(Ordinal Encoding);
  • C. 數值標準化(Numerical Standardization);
  • D. One-hot 編碼(One-hot Encoding) ✓ 正確答案

詳細解析

交通方式是無序類別變數(Nominal Variable),火車/飛機/自駕/公車沒有大小關係,最適合用 One-hot 編碼(One-hot Encoding)處理。

難度:★★☆