某大型零售企業準備將商品推薦模型上線,專案團隊在檢視訓練資料時,發現部分商品類別(例如高價商品)樣本數量極少,而多數樣本集中於低價商品。若此不平衡問題未妥善處理,下列何種狀況最可能在實際推薦結果中發生?

iPAS 考題解析

某大型零售企業準備將商品推薦模型上線,專案團隊在檢視訓練資料時,發現部分商品類別(例如高價商品)樣本數量極少,而多數樣本集中於低價商品。若此不平衡問題未妥善處理,下列何種狀況最可能在實際推薦結果中發生?

  • A. 模型在預測時傾向輸出稀有類別,導致雖能捕捉到少數樣本,但精確率(Precision)顯著下降;
  • B. 模型由於類別分布不均,難以建立有效的線性分離邊界,進而無法收斂;
  • C. 模型過度聚焦於稀有類別樣本,導致對多數類別的預測能力下降,整體效能受損;
  • D. 模型學到的決策邊界主要由多數類別主導,忽視了稀有類別,造成該類別的召回率(Recall)大幅降低 ✓ 正確答案

詳細解析

不平衡資料(Imbalanced Data)會導致模型偏向多數類別,忽視稀有類別(高價商品),造成稀有類別的召回率(Recall)大幅降低。

難度:★★★