某製造業公司建置機器學習模型,用於預測產品是否為瑕疵品。實際生產資料中,瑕疵品比例極低,大多數樣本皆為正常品。模型測試時發現,即使模型多數預測為正常品,仍可獲得很高的整體準確率。在此情境下,若希望更有效衡量模型對瑕疵品的辨識能力,下列何者較適合作為主要評估指標?
iPAS 考題解析
某製造業公司建置機器學習模型,用於預測產品是否為瑕疵品。實際生產資料中,瑕疵品比例極低,大多數樣本皆為正常品。模型測試時發現,即使模型多數預測為正常品,仍可獲得很高的整體準確率。在此情境下,若希望更有效衡量模型對瑕疵品的辨識能力,下列何者較適合作為主要評估指標?
- A. F1-score ✓ 正確答案
- B. 均方誤差(Root Mean Squared Error, RMSE)
- C. 準確率(Accuracy)
- D. 判定係數(R², Coefficient of Determination)
詳細解析
在類別不平衡的場景中,準確率會被多數類別主導而失去鑑別力。F1-score 結合了精準率(Precision)和召回率(Recall),能更有效地評估模型對少數類別(瑕疵品)的辨識能力。
出題年份:115 難度:★★☆