某電商平台開發的顧客流失預測模型在上線數月後,預測準確率明顯下降。專案團隊懷疑顧客行為模式改變,導致模型輸入特徵的分佈與原始訓練資料不同,出現典型的資料漂移(Data Drift)問題。為了偵測並確認資料分佈是否發生變化,下列哪一種作法最合適?
iPAS 考題解析
某電商平台開發的顧客流失預測模型在上線數月後,預測準確率明顯下降。專案團隊懷疑顧客行為模式改變,導致模型輸入特徵的分佈與原始訓練資料不同,出現典型的資料漂移(Data Drift)問題。為了偵測並確認資料分佈是否發生變化,下列哪一種作法最合適?
- A. 定期重新訓練模型以應對外部變化
- B. 提升模型複雜度以捕捉更多資料變異性
- C. 增加測試資料量以提高評估準確度
- D. 計算輸入特徵分佈間的KL散度(KL Divergence) ✓ 正確答案
詳細解析
KL散度(Kullback-Leibler Divergence)是衡量兩個機率分佈差異的標準統計量,透過計算當前輸入資料與訓練資料分佈之間的KL散度,可量化資料漂移的程度,確認是否發生了顯著的分佈偏移。
出題年份:114 難度:★★☆