---
title: "預測不確定性（Forecasting Uncertainty）"
slug: forecasting-uncertainty
language: zh-TW
source: https://aiterms.tw/learning/what-is-forecasting-uncertainty
updated_at: 2026-07-04
tags: [時序分析, 模型評估, 統計方法, AI應用, source:arxiv]
ipas_term: false
type: deep-dive
---

# 預測不確定性 是什麼？

> 衡量時間序列預測結果的可靠性與波動範圍，反映未來事件的不可預測程度。

## 核心概念
預測不確定性是指在時間序列預測中，對未來事件預測結果所伴隨的固有變異性或不可預測性。它不僅僅是預測誤差的衡量，更重要的是提供一個預測值可能落入的區間範圍，即預測區間（Prediction Interval）。與點預測（Point Forecast）僅提供單一數值不同，預測不確定性透過預測區間來表達預測的置信水平，例如95%的預測區間表示未來實際值有95%的機率會落入該區間內。預測不確定性的來源多樣，包括模型本身的誤差（模型無法完美捕捉所有複雜關係）、參數估計的誤差（模型參數是從有限資料中估計而來，存在抽樣變異）、資料本身的隨機性（未來事件的固有隨機性，無法完全預測）以及未來外生變數的不可預測性。理解這些來源對於建立更穩健的預測模型和進行更有效的風險管理至關重要。

## 運作原理
量化預測不確定性的方法有多種，主要依賴於統計學和機率論。

1.  **統計模型基礎**：許多傳統的時間序列模型，如ARIMA（自迴歸整合移動平均）或指數平滑法，在其數學框架中自然地包含誤差項的假設。這些模型通常假設誤差服從特定分佈（例如常態分佈），並基於這些假設來計算預測區間。例如，對於一個具有常態分佈誤差的ARIMA模型，預測區間可以透過預測值的標準差乘以對應的Z分數來構建。
2.  **蒙地卡羅模擬（Monte Carlo Simulation）**：當模型複雜或誤差分佈不確定時，蒙地卡羅模擬是一種強大的工具。它透過重複運行模型數千次，每次從誤差項或模型參數的估計分佈中隨機抽樣，生成大量的未來情境。然後，這些模擬結果的分佈可以用來構建預測區間，例如取模擬結果的第2.5和第97.5百分位數作為95%預測區間的上下限。
3.  **自助法（Bootstrapping）**：自助法是一種非參數方法，特別適用於當模型誤差分佈未知或非常態時。它透過從模型的殘差中重複抽樣並重新擬合模型，生成多個「虛擬」的時間序列。對每個虛擬序列進行預測，然後將這些預測結果的分佈用於構建預測區間。這種方法不需要對誤差分佈做出強假設。
4.  **貝葉斯方法（Bayesian Methods）**：貝葉斯時間序列模型不僅估計點預測，還自然地產生預測值的完整後驗分佈。透過對模型參數和未來觀測值進行採樣，可以直接從後驗分佈中提取任意置信水平的預測區間。貝葉斯方法在處理小樣本資料和納入先驗知識方面具有優勢。
5.  **分位數迴歸（Quantile Regression）**：與傳統迴歸模型主要關注條件均值不同，分位數迴歸可以直接建模不同分位數的條件分佈。透過在不同分位數（例如2.5%和97.5%）上擬合模型，可以直接得到預測區間的上下限，而無需假設特定的誤差分佈。

## 實際應用
預測不確定性在多個領域具有廣泛的實際應用，對於風險管理和決策制定至關重要：

1.  **金融市場與風險管理**：在股票、債券或商品價格預測中，預測不確定性用於評估投資組合的潛在波動性（VaR, Value at Risk）。金融機構利用預測區間來設定風險限額、進行壓力測試，並為交易策略提供參考，以避免過度槓桿或未預期的損失。
2.  **供應鏈與庫存管理**：企業在規劃庫存時，不僅需要預測平均需求，更需要了解需求的可能波動範圍。透過預測不確定性，可以設定安全庫存量，以應對需求高峰或供應鏈中斷，同時避免過度庫存造成的成本浪費。這有助於優化供應鏈彈性並提升客戶滿意度。
3.  **能源需求與發電調度**：電力公司需要精確預測未來的電力需求，但需求受天氣、經濟活動等多種因素影響，存在高度不確定性。預測不確定性幫助電力調度中心評估可能的需求範圍，從而更有效地規劃發電量、儲能資源和電網容量，確保供電穩定性並避免停電風險。
4.  **醫療資源規劃**：醫院和公共衛生機構在預測疾病傳播、病床需求或藥品消耗時，預測不確定性提供了對未來情境的更全面理解。這有助於提前調配醫療人員、設備和藥物，以應對可能的疫情爆發或季節性疾病高峰，確保醫療系統的韌性。
5.  **政策制定與經濟預測**：政府機構在制定財政、貨幣或社會政策時，需要依賴經濟指標的預測。預測不確定性提供了對GDP成長、通膨率或失業率可能波動範圍的洞察，使政策制定者能夠評估不同政策方案在各種情境下的潛在影響，並制定更具彈性的應對策略。

## 常見誤區
在使用和解釋預測不確定性時，存在一些常見的誤區，需要特別注意：

1.  **預測區間過窄**：這是最常見的誤區之一，導致對未來不確定性的低估。可能的原因包括模型未能捕捉所有相關變數、模型假設過於簡化（例如假設誤差為常態分佈而實際不然）、未考慮模型參數估計的不確定性，或資料中存在未被模型解釋的結構性變化（如趨勢變化、季節性模式改變）。過窄的區間會給決策者帶來錯誤的安全感，導致風險暴露過高。
2.  **模型假設不符**：許多統計方法依賴於特定的假設，例如誤差項的獨立性、同方差性或常態分佈。如果這些假設在實際資料中不成立，則基於這些假設構建的預測區間可能不準確。例如，時間序列中常見的異方差性（誤差方差隨時間變化）會導致預測區間的寬度不一致，需要使用更穩健的方法。
3.  **外推能力不足**：當預測期超出訓練資料的範圍太遠時，模型的預測能力會顯著下降，預測不確定性會大幅增加。模型在訓練資料範圍內表現良好，不代表其在外推時依然可靠。特別是當未來環境與過去存在顯著差異時（例如技術變革、政策巨變），基於歷史資料構建的預測區間可能無法有效捕捉這些新的不確定性。
4.  **未考慮結構性變化**：時間序列資料可能經歷結構性變化，如經濟危機、新產品推出或法規調整，這些變化會導致資料生成過程的根本性改變。如果模型未能及時識別並適應這些變化，其預測區間將無法準確反映新的不確定性水平。這需要模型具備適應性或定期重新評估。
5.  **過度依賴單一指標**：僅依賴預測區間的寬度來判斷不確定性可能不夠全面。應結合其他評估指標，如覆蓋率（Prediction Interval Coverage Probability, PICP）來檢查實際值落入區間的頻率是否與置信水平一致，以及區間的平均寬度（Mean Prediction Interval Width, MPIW）來評估區間的實用性。單一指標可能無法揭示預測不確定性的所有面向。

## 與相關技術的比較
預測不確定性與其他時間序列分析和模型評估技術有著密切的關係，但其關注點有所不同：

1.  **與點預測（Point Forecast）的比較**：點預測提供未來單一的最佳估計值，例如預計下個月銷售額為100萬元。而預測不確定性則在此基礎上，提供一個範圍，例如預計下個月銷售額在90萬到110萬之間，有95%的機率。點預測回答「會是多少？」，而預測不確定性回答「可能在哪個範圍內？以及有多大的把握？」。兩者是互補的，點預測提供了最佳猜測，而預測不確定性則量化了這個猜測的可靠性。
2.  **與誤差指標（Error Metrics）的比較**：MAE（平均絕對誤差）、RMSE（均方根誤差）、MAPE（平均絕對百分比誤差）等誤差指標是回顧性的，它們衡量的是模型在過去資料或測試集上預測值與實際值之間的平均偏差。這些指標用於評估模型的歷史表現和準確性。然而，預測不確定性是前瞻性的，它試圖量化未來預測的固有變異性，即使一個模型在歷史上表現良好，其未來的預測仍可能存在較大的不確定性。誤差指標評估「模型過去做得如何？」，預測不確定性評估「模型未來可能錯多少？」。
3.  **與異常偵測（Anomaly Detection）的關係**：預測不確定性可以輔助異常偵測。當實際觀測值落在預測區間之外時，這可能是一個異常點的信號。如果一個點遠遠超出預測區間的上下限，它很可能是一個統計上的異常值。然而，異常偵測的目標是識別不尋常的模式或事件，而預測不確定性則是量化預測的可靠性。兩者可以結合使用，例如，先用預測區間標記潛在異常，再用專門的異常偵測演算法進行進一步分析和確認。
4.  **與信賴區間（Confidence Interval）的區別**：信賴區間通常用於估計模型參數或某個統計量的真實值，例如「某參數的95%信賴區間為[a, b]」。它反映的是對參數估計的精確度。而預測區間則是用於估計未來單一觀測值的範圍，它不僅考慮了參數估計的不確定性，還包含了未來觀測值本身的隨機性。因此，預測區間通常比信賴區間更寬，因為它需要解釋更多的變異來源。

## 常見問題

### 預測不確定性為何如此重要？

預測不確定性之所以重要，是因為它為決策者提供了比單一預測值更全面的資訊。僅依賴點預測可能導致對未來風險的低估或高估。透過量化不確定性，決策者能夠理解預測結果的可靠程度，並在決策中納入風險考量。例如，在供應鏈管理中，了解需求預測的不確定性有助於設定合理的安全庫存，避免因需求波動導致的缺貨或過剩。在金融投資中，預測不確定性可以幫助評估投資組合的潛在波動性，從而制定更穩健的風險管理策略。它使得決策不再是基於單一最佳猜測，而是基於對未來可能情境的全面評估，提升決策的韌性與穩健性。

### 預測不確定性通常如何量化？

預測不確定性通常透過構建預測區間（Prediction Interval）來量化。最常見的方法包括基於統計模型的誤差分佈假設，例如ARIMA模型會利用殘差的標準差來計算預測區間。當模型複雜或誤差分佈未知時，蒙地卡羅模擬（Monte Carlo Simulation）和自助法（Bootstrapping）是常用的非參數方法。蒙地卡羅模擬透過重複隨機抽樣生成大量未來情境，然後從這些情境的分佈中提取區間。自助法則透過對模型殘差進行重抽樣來生成多個預測序列，進而構建區間。此外，貝葉斯方法能自然地提供預測值的後驗分佈，而分位數迴歸則直接建模不同分位數的條件分佈，從而得到預測區間的上下限。這些方法各有優勢，適用於不同情境和資料特性。

### 預測不確定性的主要來源有哪些？

預測不確定性的主要來源可以分為幾類。首先是**模型誤差**，沒有任何模型能夠完美捕捉現實世界的複雜性，模型對真實資料生成過程的近似會引入誤差。其次是**參數估計誤差**，模型中的參數是從有限的歷史資料中估計而來，這些估計值本身就帶有不確定性，會影響預測的精確度。第三是**資料本身的隨機性**，未來事件的發生具有內在的隨機性，即使模型完美且參數已知，也無法完全消除這種固有變異。最後是**外生變數的不確定性**，如果預測模型依賴於未來的外生變數（如未來利率、天氣狀況），而這些變數本身也需要預測，那麼它們的預測誤差也會傳導到最終的預測結果中，進一步增加不確定性。理解這些來源有助於選擇合適的建模方法和量化技術。

---

深度解說頁：https://aiterms.tw/learning/what-is-forecasting-uncertainty
快查頁：https://aiterms.tw/terms/forecasting-uncertainty
最後更新：2026/07/04