---
title: "隨機失活遮罩（Dropout Masking）"
slug: dropout-masking
language: zh-TW
source: https://aiterms.tw/terms/dropout-masking
updated_at: 2026-07-04
tags: [機器學習, 深度學習, 模型訓練, 神經網路, source:ipas]
ipas_term: true
---

# 隨機失活遮罩（Dropout Masking）

隨機失活遮罩在訓練時動態產生隨機二元矩陣，將部分神經元輸出暫時歸零，以打破特徵依賴並防止模型過度擬合。

## 完整說明

隨機失活遮罩是一種在神經網路訓練過程中動態生成的隨機二元矩陣，由零與一組成。它用於將部分神經元的輸出強制歸零，使每次運算都如同訓練不同的子網路，藉此打破神經元間的共適應關係並限制對單一特徵的依賴。這項技術能夠有效降低過度擬合風險，提升泛化表現。常見應用包括多層感知機、卷積神經網路及 Transformer 等各類深度學習模型的常規訓練過程，是提升模型穩健性的核心基礎。

## iPAS 考試出題分析

屬於未分類考範圍。

## 常見問題

### 為什麼推論階段不需要套用隨機失活遮罩？

在神經網路的推論階段，我們的目標是獲得模型最穩定且精確的預測結果，而不是像訓練階段那樣為了防止過度擬合而刻意引入隨機干擾。如果在推論時依然套用隨機失活遮罩，每次輸入同一筆資料都會因為被遮蔽的神經元不同而產生波動的輸出結果，這在多數應用場景中是不可接受的。因此，推論階段會停止生成並應用這些隨機遮罩，讓所有神經元都參與運算，藉此利用整個網路的完整表徵能力。為了保持數學上的期望值一致性，現代框架會在訓練階段預先透過反轉機制放大保留神經元的權重，使得推論過程無需任何額外計算即可順利進行。

### 隨機失活遮罩中的丟棄機率應該如何設定？

隨機失活遮罩中的丟棄機率是一個關鍵的超參數，需要根據網路的具體架構和資料集特性來進行調整。在深層神經網路的隱藏層中，常見的起始設定值為零點五的機率，因為這個數值能產生最大程度的結構隨機性，帶來顯著的正則化效果。然而，對於接近輸入層的神經元，過高的丟棄機率可能會導致大量原始特徵流失，因此通常會設定較低的機率數值。如果模型參數極多且資料稀缺，可能需要稍微提高丟棄機率來抑制過度擬合；反之，若模型出現欠擬合現象，則應考慮降低或移除遮罩機制。實務上透過交叉驗證尋找最佳數值是確保效能的標準流程。

### 隨機失活遮罩會對模型訓練速度造成什麼影響？

隨機失活遮罩對模型訓練速度的影響呈現雙面性。從單次前向與反向傳播的計算負載來看，生成並套用二元遮罩矩陣雖然涉及額外的隨機數生成與矩陣乘法，但得益於現代硬體加速器強大的平行計算能力，這部分運算帶來的時間開銷極其微小。然而，從模型整體的收斂軌跡來評估，由於每次迭代都只有部分神經元參與特徵學習並更新權重，這相當於模型在學習路徑上不斷受到隨機干擾，導致需要更多倍的迭代次數才能達到預期的損失值。儘管達到完全收斂的時間可能顯著增加，但這項犧牲換來的是模型泛化能力的提升與過度擬合風險的降低，在實務工程中被認為是非常值得的投入。

---

來源：https://aiterms.tw/terms/dropout-masking
快查頁：https://aiterms.tw/terms/dropout-masking
最後更新：2026/07/04
深度解說：https://aiterms.tw/learning/what-is-dropout-masking