某AI團隊在分析一組連續型數據時,發現部分紀錄的數值明顯高於其他資料點。若專案目標是識別高價值客戶的行為模式,下列哪一種處理方式最為合適?

iPAS 考題解析

某AI團隊在分析一組連續型數據時,發現部分紀錄的數值明顯高於其他資料點。若專案目標是識別高價值客戶的行為模式,下列哪一種處理方式最為合適?

  • A. 立即刪除離群值,以避免模型訓練時出現偏差
  • B. 視為錯誤值並全部替換為平均值
  • C. 保留離群值並標註為高價值異常點,納入後續模型訓練考量 ✓ 正確答案
  • D. 將離群值全數轉換為中位數,避免影響平均計算

詳細解析

目標是識別高價值客戶,離群值(Outlier)可能正是高價值客戶的特徵,應保留並標註而非刪除。

難度:★★☆