某大型零售企業準備將商品推薦模型上線,專案團隊在檢視訓練資料時,發現部分商品類別(例如高價商品)樣本數量極少,而多數樣本集中於低價商品。若此不平衡問題未妥善處理,下列何種狀況最可能在實際推薦結果中發生?
iPAS 考題解析
某大型零售企業準備將商品推薦模型上線,專案團隊在檢視訓練資料時,發現部分商品類別(例如高價商品)樣本數量極少,而多數樣本集中於低價商品。若此不平衡問題未妥善處理,下列何種狀況最可能在實際推薦結果中發生?
- A. 模型在預測時傾向輸出稀有類別,導致雖能捕捉到少數樣本,但精確率(Precision)顯著下降;
- B. 模型由於類別分布不均,難以建立有效的線性分離邊界,進而無法收斂;
- C. 模型過度聚焦於稀有類別樣本,導致對多數類別的預測能力下降,整體效能受損;
- D. 模型學到的決策邊界主要由多數類別主導,忽視了稀有類別,造成該類別的召回率(Recall)大幅降低 ✓ 正確答案
詳細解析
在資料不平衡的情況下,模型會傾向學習多數類別的模式,因為這樣能最小化整體損失。結果是模型在稀有類別(高價商品)上的召回率大幅降低,因為模型很少預測出這些稀有類別。
出題年份:114 難度:★★☆