什麼是 卡方檢定(Chi-squared Test)?

卡方檢定是一種統計方法,用於檢驗兩個或多個類別變數之間是否存在顯著關聯性。它比較觀察值與期望值之間的差異。

核心概念

卡方檢定 (Chi-squared test) 是一種非參數統計檢定方法,主要用於分析類別變數之間的關聯性。它基於比較觀察到的頻率與期望的頻率之間的差異,來判斷兩個變數是否獨立。如果觀察到的頻率與期望的頻率之間的差異很大,則可以推斷兩個變數之間存在關聯。

卡方檢定有多種類型,最常見的是皮爾森卡方檢定 (Pearson's chi-squared test),用於檢驗兩個類別變數之間的獨立性。此外,還有卡方適合度檢定 (Chi-squared goodness-of-fit test),用於檢驗觀察到的資料是否符合特定的理論分佈。

關鍵概念:

  • 類別變數 (Categorical variable): 只能取有限個值的變數,例如性別、顏色、地區等。
  • 觀察頻率 (Observed frequency): 實際觀察到的各類別的數量。
  • 期望頻率 (Expected frequency): 在假設兩個變數獨立的情況下,各類別應該出現的數量。
  • 自由度 (Degrees of freedom): 決定卡方分佈形狀的參數,通常與類別數量有關。
  • 顯著性水平 (Significance level, α): 用於判斷檢定結果是否顯著的閾值,通常設定為 0.05。
  • p值 (p-value): 在假設虛無假設為真的情況下,觀察到目前樣本或更極端樣本的機率。

運作原理

卡方檢定的運作原理可以分為以下幾個步驟:

  1. 建立虛無假設 (Null hypothesis) 和對立假設 (Alternative hypothesis):

    • 虛無假設:兩個變數之間沒有關聯。
    • 對立假設:兩個變數之間存在關聯。
  2. 建立列聯表 (Contingency table): 列聯表是一個二維表格,用於顯示兩個類別變數的頻率分佈。表格的行和列分別代表兩個變數的類別,表格中的每個單元格包含對應類別組合的觀察頻率。

  3. 計算期望頻率: 在假設兩個變數獨立的情況下,可以根據邊際頻率計算出每個單元格的期望頻率。期望頻率的計算公式如下:

    期望頻率 = (行總和 * 列總和) / 總樣本數

  4. 計算卡方統計量 (Chi-squared statistic): 卡方統計量用於衡量觀察頻率與期望頻率之間的差異。計算公式如下:

    χ² = Σ [(觀察頻率 - 期望頻率)² / 期望頻率]

    其中,Σ 表示對所有單元格求和。

  5. 計算自由度: 自由度取決於列聯表的行數和列數。計算公式如下:

    自由度 = (行數 - 1) * (列數 - 1)

  6. 判斷顯著性: 將計算出的卡方統計量與卡方分佈的臨界值進行比較,或者計算 p 值。如果卡方統計量大於臨界值,或者 p 值小於顯著性水平 α,則拒絕虛無假設,認為兩個變數之間存在顯著關聯。

實際應用

卡方檢定廣泛應用於各個領域,以下是一些常見的例子:

  • 醫學研究: 檢驗某種治療方法是否與患者的康復情況有關聯。
  • 市場研究: 檢驗某種產品的廣告是否與消費者的購買意願有關聯。
  • 社會科學: 檢驗性別是否與政治立場有關聯。
  • A/B測試: 檢驗兩個不同版本的網頁或應用程式是否對使用者行為產生影響。
  • 機器學習: 評估分類模型的性能,例如檢驗模型預測的類別與實際類別之間是否存在關聯。

範例:

假設我們想檢驗性別與是否喜歡某種產品之間是否存在關聯。我們收集了 100 個樣本,並建立了以下列聯表:

喜歡產品 不喜歡產品 總計
男性 30 20 50
女性 40 10 50
總計 70 30 100

根據上述數據,我們可以計算出期望頻率、卡方統計量和 p 值。如果 p 值小於 0.05,則我們可以拒絕虛無假設,認為性別與是否喜歡該產品之間存在顯著關聯。

常見誤區

  • 卡方檢定只能檢驗關聯性,不能證明因果關係。 即使兩個變數之間存在顯著關聯,也不能斷定其中一個變數是另一個變數的原因。
  • 卡方檢定要求樣本量足夠大。 如果樣本量太小,檢定結果可能不準確。通常建議每個單元格的期望頻率至少為 5。
  • 卡方檢定只能用於類別變數。 如果變數是連續的,需要先將其轉換為類別變數。
  • 卡方檢定對異常值敏感。 異常值可能會對檢定結果產生很大的影響。
  • 卡方檢定假設樣本是獨立的。 如果樣本之間存在相關性,檢定結果可能不準確。

相關術語

常見問題

← 回到 卡方檢定 快查頁

延伸學習

想看 卡方檢定 的完整影片教學?前往 美第奇 AI 學院