什麼是 變異數分析(ANOVA)?

變異數分析 (ANOVA) 是一種統計方法,用於比較兩個或多個群體的平均數是否存在顯著差異。它將總變異分解為不同來源的變異。

核心概念

變異數分析 (Analysis of Variance, ANOVA) 是一種統計方法,主要用於比較兩個或多個群體的平均數之間是否存在顯著差異。與 t 檢定只能比較兩組平均數不同,ANOVA 可以同時比較多組平均數,因此在實驗設計和研究中應用廣泛。

ANOVA 的核心思想是將總變異分解為不同來源的變異,例如組間變異 (Between-group variability) 和組內變異 (Within-group variability)。組間變異反映了不同組別之間的差異,而組內變異反映了同一組別內個體之間的差異。如果組間變異遠大於組內變異,則可以認為不同組別的平均數之間存在顯著差異。

關鍵概念:

  • 自變數 (Independent variable): 也稱為因子 (Factor),是研究者操縱或觀察的變數,用於區分不同的組別。
  • 依變數 (Dependent variable): 是研究者測量的變數,用於比較不同組別之間的差異。
  • 組間變異 (Between-group variability): 反映不同組別之間的差異,由自變數的影響引起。
  • 組內變異 (Within-group variability): 反映同一組別內個體之間的差異,由隨機誤差引起。
  • F 統計量 (F-statistic): 用於衡量組間變異與組內變異的比率,是 ANOVA 的主要檢定統計量。
  • 自由度 (Degrees of freedom): 決定 F 分佈形狀的參數,與組別數量和樣本大小有關。
  • 顯著性水平 (Significance level, α): 用於判斷檢定結果是否顯著的閾值,通常設定為 0.05。
  • p值 (p-value): 在假設虛無假設為真的情況下,觀察到目前樣本或更極端樣本的機率。

運作原理

ANOVA 的運作原理可以分為以下幾個步驟:

  1. 建立虛無假設 (Null hypothesis) 和對立假設 (Alternative hypothesis):

    • 虛無假設:所有組別的平均數都相等。
    • 對立假設:至少有一組的平均數與其他組別不同。
  2. 計算總變異 (Total variation): 總變異反映了所有樣本點之間的總體差異。通常使用總平方和 (Sum of Squares Total, SST) 來衡量總變異。

  3. 計算組間變異 (Between-group variation): 組間變異反映了不同組別之間的差異。通常使用組間平方和 (Sum of Squares Between, SSB) 來衡量組間變異。

  4. 計算組內變異 (Within-group variation): 組內變異反映了同一組別內個體之間的差異。通常使用組內平方和 (Sum of Squares Within, SSW) 來衡量組內變異。

  5. 計算 F 統計量: F 統計量用於衡量組間變異與組內變異的比率。計算公式如下:

    F = (MSB / MSW)

    其中,MSB (Mean Square Between) 是組間均方,等於 SSB 除以組間自由度;MSW (Mean Square Within) 是組內均方,等於 SSW 除以組內自由度。

  6. 計算自由度:

    • 組間自由度 = 組別數量 - 1
    • 組內自由度 = 總樣本數 - 組別數量
  7. 判斷顯著性: 將計算出的 F 統計量與 F 分佈的臨界值進行比較,或者計算 p 值。如果 F 統計量大於臨界值,或者 p 值小於顯著性水平 α,則拒絕虛無假設,認為至少有一組的平均數與其他組別不同。

  8. 事後檢定 (Post-hoc test): 如果 ANOVA 檢定結果顯著,則需要進行事後檢定,以確定哪些組別的平均數之間存在顯著差異。常見的事後檢定方法包括 Tukey HSD、Bonferroni 校正和 Scheffé 檢定。

實際應用

ANOVA 廣泛應用於各個領域,以下是一些常見的例子:

  • 醫學研究: 比較不同藥物對疾病治療效果的差異。
  • 農業研究: 比較不同肥料對作物產量的影響。
  • 工程研究: 比較不同設計方案對產品性能的影響。
  • 心理學研究: 比較不同教學方法對學生學習成績的影響。
  • 市場研究: 比較不同廣告策略對銷售額的影響。

範例:

假設我們想比較三種不同的教學方法對學生考試成績的影響。我們隨機將學生分配到三個組別,每個組別接受不同的教學方法。在考試結束後,我們收集了每個學生的成績,並使用 ANOVA 進行分析。如果 ANOVA 檢定結果顯著,則我們可以認為至少有一種教學方法對學生的考試成績產生了顯著影響。然後,我們可以使用事後檢定來確定哪些教學方法之間存在顯著差異。

常見誤區

  • ANOVA 只能檢驗平均數的差異,不能檢驗變異數的差異。 如果不同組別的變異數差異很大,ANOVA 的結果可能不準確。在這種情況下,可以使用 Welch's ANOVA 或 Brown-Forsythe 檢定。
  • ANOVA 要求數據符合常態分佈。 如果數據不符合常態分佈,可以使用非參數檢定方法,例如 Kruskal-Wallis 檢定。
  • ANOVA 假設各組別的樣本是獨立的。 如果樣本之間存在相關性,ANOVA 的結果可能不準確。在這種情況下,可以使用重複測量 ANOVA。
  • ANOVA 只能檢驗自變數對依變數的影響,不能檢驗其他因素的影響。 如果存在其他因素可能影響依變數,需要使用更複雜的統計模型,例如 ANCOVA (Analysis of Covariance)。
  • 顯著性並不代表實際意義。 即使 ANOVA 檢定結果顯著,也需要考慮實際意義。例如,即使兩種教學方法的考試成績存在顯著差異,但差異很小,可能沒有實際應用價值。

相關術語

常見問題

← 回到 變異數分析 快查頁

延伸學習

想看 變異數分析 的完整影片教學?前往 美第奇 AI 學院