某電信公司建立機器學習模型預測用戶流失風險。資料中包含多個類別型特徵(Categorical Features),例如「資費方案類型」與「客戶地區」。為使模型能有效使用這些特徵,下列何者最直接用於將類別型特徵轉換為模型可處理的數值格式?
iPAS 考題解析
某電信公司建立機器學習模型預測用戶流失風險。資料中包含多個類別型特徵(Categorical Features),例如「資費方案類型」與「客戶地區」。為使模型能有效使用這些特徵,下列何者最直接用於將類別型特徵轉換為模型可處理的數值格式?
- A. 資料分群(Data Clustering)
- B. 特徵交叉(Feature Cross)
- C. One-hot 編碼(One-hot Encoding) ✓ 正確答案
- D. 寬深模型(Wide and Deep)
詳細解析
One-hot 編碼是最直接將類別型特徵轉換為數值格式的方法。它將每個類別值轉換為一個二元向量,使模型能夠處理類別型資料。
出題年份:115 難度:★★☆