什麼是 貝氏定理(Bayes Theorem)?

貝氏定理描述在已知一些條件下,事件發生的機率。它基於先驗機率、條件機率和證據,更新對事件的信念。

核心概念

貝氏定理的核心在於條件機率的概念,也就是在已知某事件發生的前提下,另一事件發生的機率。它將先驗機率(在觀察到任何證據之前的初始信念)與基於證據的條件機率結合起來,得到後驗機率(在觀察到證據之後更新的信念)。

  • 先驗機率 (Prior Probability): 事件發生前,我們對該事件發生的主觀機率估計。例如,在診斷疾病之前,我們可能知道人群中患有該疾病的比例(先驗機率)。
  • 條件機率 (Likelihood): 在假設事件發生的前提下,觀察到特定證據的機率。例如,如果某人患有某種疾病,那麼檢測結果呈陽性的機率。
  • 證據 (Evidence): 我們實際觀察到的數據或信息。例如,檢測結果呈陽性。
  • 後驗機率 (Posterior Probability): 在觀察到證據之後,事件發生的更新機率。例如,在檢測結果呈陽性的情況下,某人實際患有該疾病的機率。

貝氏定理的數學公式如下:

P(A|B) = [P(B|A) * P(A)] / P(B)

其中:

  • P(A|B) 是在 B 發生的條件下,A 發生的機率(後驗機率)。
  • P(B|A) 是在 A 發生的條件下,B 發生的機率(條件機率)。
  • P(A) 是 A 發生的機率(先驗機率)。
  • P(B) 是 B 發生的機率(證據)。

運作原理

貝氏定理的運作原理可以概括為以下幾個步驟:

  1. 確定先驗機率: 首先,需要確定我們對事件發生的初始信念(先驗機率)。這可能基於歷史數據、專家意見或任何其他可用的信息。
  2. 確定條件機率: 接下來,需要確定在假設事件發生的前提下,觀察到特定證據的機率(條件機率)。這通常需要基於實驗數據或理論模型。
  3. 計算證據的機率: 然後,需要計算觀察到證據的總機率。這可以通過對所有可能的事件(包括事件發生和事件不發生)的條件機率進行加權平均來計算。
  4. 計算後驗機率: 最後,使用貝氏定理的公式,將先驗機率、條件機率和證據的機率結合起來,計算後驗機率。後驗機率代表了在觀察到證據之後,我們對事件發生的更新信念。

舉例說明:

假設有一種罕見疾病,人群中患病率為 1% (P(Disease) = 0.01)。有一種檢測方法,如果某人患有該疾病,檢測結果呈陽性的機率為 95% (P(Positive|Disease) = 0.95)。如果某人沒有患病,檢測結果呈陽性的機率為 5% (P(Positive|No Disease) = 0.05)。

現在,某人的檢測結果呈陽性。我們想知道此人真正患有該疾病的機率 (P(Disease|Positive))。

根據貝氏定理:

P(Disease|Positive) = [P(Positive|Disease) * P(Disease)] / P(Positive)

首先,需要計算 P(Positive):

P(Positive) = P(Positive|Disease) * P(Disease) + P(Positive|No Disease) * P(No Disease) = 0.95 * 0.01 + 0.05 * 0.99 = 0.059

然後,計算 P(Disease|Positive):

P(Disease|Positive) = (0.95 * 0.01) / 0.059 = 0.161

因此,即使檢測結果呈陽性,此人真正患有該疾病的機率也只有 16.1%。這說明了在罕見事件中,即使檢測方法的準確性很高,也可能出現較高的假陽性率。

實際應用

貝氏定理在許多領域都有廣泛的應用,包括:

  • 醫學診斷: 根據患者的症狀和檢測結果,判斷患者患有某種疾病的機率。
  • 垃圾郵件過濾: 根據郵件的內容,判斷郵件是否為垃圾郵件。
  • 機器學習: 用於構建貝氏分類器,例如樸素貝氏分類器。
  • 金融風險評估: 評估貸款違約的機率。
  • 自然語言處理: 用於語音辨識、機器翻譯等任務。
  • A/B測試: 評估不同版本網頁或產品的表現。
  • 異常偵測: 識別異常事件或行為。

常見誤區

  • 忽略先驗機率: 有些人可能會忽略先驗機率,只關注條件機率。這可能導致錯誤的結論,尤其是在罕見事件中。
  • 混淆條件機率和後驗機率: 條件機率 P(B|A) 和後驗機率 P(A|B) 是不同的概念。P(B|A) 是在 A 發生的條件下,B 發生的機率,而 P(A|B) 是在 B 發生的條件下,A 發生的機率。
  • 假設條件獨立性: 在使用樸素貝氏分類器時,通常假設各個特徵之間是條件獨立的。然而,在實際應用中,這種假設可能不成立,從而影響分類器的性能。
  • 過度自信: 貝氏定理可以幫助我們更新對事件的信念,但我們不應該過度自信。即使後驗機率很高,仍然存在不確定性。
  • 數據偏差: 如果用於計算先驗機率和條件機率的數據存在偏差,那麼貝氏定理的結果也可能存在偏差。

相關術語

常見問題

← 回到 貝氏定理 快查頁

延伸學習

想看 貝氏定理 的完整影片教學?前往 美第奇 AI 學院