某電信公司建立機器學習模型預測用戶流失風險。資料中包含多個類別型特徵(Categorical Features),例如「資費方案類型」與「客戶地區」。為使模型能有效使用這些特徵,下列何者最直接用於將類別型特徵轉換為模型可處理的數值格式?

iPAS 考題解析

某電信公司建立機器學習模型預測用戶流失風險。資料中包含多個類別型特徵(Categorical Features),例如「資費方案類型」與「客戶地區」。為使模型能有效使用這些特徵,下列何者最直接用於將類別型特徵轉換為模型可處理的數值格式?

  • A. 資料分群(Data Clustering)
  • B. 特徵交叉(Feature Cross)
  • C. One-hot 編碼(One-hot Encoding) ✓ 正確答案
  • D. 寬深模型(Wide and Deep)

詳細解析

One-hot 編碼是最直接將類別型特徵轉換為數值格式的方法。它將每個類別值轉換為一個二元向量,使模型能夠處理類別型資料。

出題年份:115 難度:★★☆