卡方檢定(Chi-squared Test)
卡方檢定是一種統計方法,用於檢驗兩個或多個類別變數之間是否存在顯著關聯性。它比較觀察值與期望值之間的差異。
完整說明
核心概念
卡方檢定 (Chi-squared test) 是一種非參數統計檢定方法,主要用於分析類別變數之間的關聯性。它基於比較觀察到的頻率與期望的頻率之間的差異,來判斷兩個變數是否獨立。如果觀察到的頻率與期望的頻率之間的差異很大,則可以推斷兩個變數之間存在關聯。
卡方檢定有多種類型,最常見的是皮爾森卡方檢定 (Pearson's chi-squared test),用於檢驗兩個類別變數之間的獨立性。此外,還有卡方適合度檢定 (Chi-squared goodness-of-fit test),用於檢驗觀察到的資料是否符合特定的理論分佈。
關鍵概念:
- 類別變數 (Categorical variable): 只能取有限個值的變數,例如性別、顏色、地區等。
- 觀察頻率 (Observed frequency): 實際觀察到的各類別的數量。
- 期望頻率 (Expected frequency): 在假設兩個變數獨立的情況下,各類別應該出現的數量。
- 自由度 (Degrees of freedom): 決定卡方分佈形狀的參數,通常與類別數量有關。
- 顯著性水平 (Significance level, α): 用於判斷檢定結果是否顯著的閾值,通常設定為 0.05。
- p值 (p-value): 在假設虛無假設為真的情況下,觀察到目前樣本或更極端樣本的機率。
運作原理
卡方檢定的運作原理可以分為以下幾個步驟:
建立虛無假設 (Null hypothesis) 和對立假設 (Alternative hypothesis):
- 虛無假設:兩個變數之間沒有關聯。
- 對立假設:兩個變數之間存在關聯。
建立列聯表 (Contingency table): 列聯表是一個二維表格,用於顯示兩個類別變數的頻率分佈。表格的行和列分別代表兩個變數的類別,表格中的每個單元格包含對應類別組合的觀察頻率。
計算期望頻率: 在假設兩個變數獨立的情況下,可以根據邊際頻率計算出每個單元格的期望頻率。期望頻率的計算公式如下:
期望頻率 = (行總和 * 列總和) / 總樣本數
計算卡方統計量 (Chi-squared statistic): 卡方統計量用於衡量觀察頻率與期望頻率之間的差異。計算公式如下:
χ² = Σ [(觀察頻率 - 期望頻率)² / 期望頻率]
其中,Σ 表示對所有單元格求和。
計算自由度: 自由度取決於列聯表的行數和列數。計算公式如下:
自由度 = (行數 - 1) * (列數 - 1)
判斷顯著性: 將計算出的卡方統計量與卡方分佈的臨界值進行比較,或者計算 p 值。如果卡方統計量大於臨界值,或者 p 值小於顯著性水平 α,則拒絕虛無假設,認為兩個變數之間存在顯著關聯。
實際應用
卡方檢定廣泛應用於各個領域,以下是一些常見的例子:
- 醫學研究: 檢驗某種治療方法是否與患者的康復情況有關聯。
- 市場研究: 檢驗某種產品的廣告是否與消費者的購買意願有關聯。
- 社會科學: 檢驗性別是否與政治立場有關聯。
- A/B測試: 檢驗兩個不同版本的網頁或應用程式是否對使用者行為產生影響。
- 機器學習: 評估分類模型的性能,例如檢驗模型預測的類別與實際類別之間是否存在關聯。
範例:
假設我們想檢驗性別與是否喜歡某種產品之間是否存在關聯。我們收集了 100 個樣本,並建立了以下列聯表:
| 喜歡產品 | 不喜歡產品 | 總計 | |
|---|---|---|---|
| 男性 | 30 | 20 | 50 |
| 女性 | 40 | 10 | 50 |
| 總計 | 70 | 30 | 100 |
根據上述數據,我們可以計算出期望頻率、卡方統計量和 p 值。如果 p 值小於 0.05,則我們可以拒絕虛無假設,認為性別與是否喜歡該產品之間存在顯著關聯。
常見誤區
- 卡方檢定只能檢驗關聯性,不能證明因果關係。 即使兩個變數之間存在顯著關聯,也不能斷定其中一個變數是另一個變數的原因。
- 卡方檢定要求樣本量足夠大。 如果樣本量太小,檢定結果可能不準確。通常建議每個單元格的期望頻率至少為 5。
- 卡方檢定只能用於類別變數。 如果變數是連續的,需要先將其轉換為類別變數。
- 卡方檢定對異常值敏感。 異常值可能會對檢定結果產生很大的影響。
- 卡方檢定假設樣本是獨立的。 如果樣本之間存在相關性,檢定結果可能不準確。
相關術語
常見問題
延伸學習
延伸學習
想看 卡方檢定 的完整影片教學?前往 美第奇 AI 學院