某製造業公司建置機器學習模型，用於預測產品是否為瑕疵品。實際生產資料中，瑕疵品比例極低，大多數樣本皆為正常品。模型測試時發現，即使模型多數預測為正常品，仍可獲得很高的整體準確率。在此情境下，若希望更有效衡量模型對瑕疵品的辨識能力，下列何者較適合作為主要評估指標？

Question

Accepted Answer

A. F1-score。在類別不平衡的場景中，準確率會被多數類別主導而失去鑑別力。F1-score 結合了精準率（Precision）和召回率（Recall），能更有效地評估模型對少數類別（瑕疵品）的辨識能力。

Answer

A. F1-score

Answer

B. 均方誤差（Root Mean Squared Error, RMSE）

Answer

C. 準確率（Accuracy）

Answer

D. 判定係數（R², Coefficient of Determination）

iPAS 考題解析