某組資料共10項標籤如下:A, A, A, A, A, B, B, B, B, B。若該標籤僅有A、B兩種,請問這組資料的「正規化吉尼不純度(Normalized Gini impurity)」為何?
iPAS 考題解析
某組資料共10項標籤如下:A, A, A, A, A, B, B, B, B, B。若該標籤僅有A、B兩種,請問這組資料的「正規化吉尼不純度(Normalized Gini impurity)」為何?
- A. 0
- B. 0.42
- C. 0.84
- D. 1 ✓ 正確答案
詳細解析
吉尼不純度 = 1 - (5/10)² - (5/10)² = 1 - 0.25 - 0.25 = 0.5。對於二元分類,最大吉尼不純度為0.5,正規化吉尼不純度 = 0.5 / 0.5 = 1.0,表示兩類完全均等,不純度最高。
出題年份:114 難度:★★☆