某組資料共10項標籤如下:A, A, A, A, A, B, B, B, B, B。若該標籤僅有A、B兩種,請問這組資料的「正規化吉尼不純度(Normalized Gini impurity)」為何?

iPAS 考題解析

某組資料共10項標籤如下:A, A, A, A, A, B, B, B, B, B。若該標籤僅有A、B兩種,請問這組資料的「正規化吉尼不純度(Normalized Gini impurity)」為何?

  • A. 0
  • B. 0.42
  • C. 0.84
  • D. 1 ✓ 正確答案

詳細解析

吉尼不純度 = 1 - (5/10)² - (5/10)² = 1 - 0.25 - 0.25 = 0.5。對於二元分類,最大吉尼不純度為0.5,正規化吉尼不純度 = 0.5 / 0.5 = 1.0,表示兩類完全均等,不純度最高。

出題年份:114 難度:★★☆