---
title: "隨機遮蔽（Random Masking）"
slug: random-masking
language: zh-TW
source: https://aiterms.tw/terms/random-masking
updated_at: 2026-07-04
tags: [自監督學習, 深度學習, 自然語言處理, 模型訓練, source:ipas]
ipas_term: true
---

# 隨機遮蔽（Random Masking）

隨機遮蔽是隱藏部分資料的自監督技術，迫使模型從剩餘資訊推斷缺失內容，以提升特徵提取與泛化能力。

## 完整說明

隨機遮蔽是一種在模型訓練時故意隱藏部分輸入資料的技術。它用於強迫網路從剩餘資訊推斷缺失內容，能夠防止模型過度擬合局部特徵，並提升全局特徵提取能力。常見應用包括自然語言處理的掩碼語言建模、視覺領域的掩碼影像建模，以及各種序列資料的自監督預訓練。

## iPAS 考試出題分析

屬於未分類考範圍。

## 常見問題

### 隨機遮蔽比例設定多少比較合適？

隨機遮蔽比例的設定取決於資料類型，並無固定數值。對於資訊密度高、各單元承載關鍵語義的資料（如自然語言文本），遮蔽比例通常較低，以免破壞整體語義連貫性。相對地，對於資訊冗餘度高的資料（如高解析度影像），因相鄰像素具極強空間相似性，通常會採用相當高的遮蔽比例。這樣能迫使模型放棄簡單局部特徵插值，轉向學習全局的高階語義表示，進而提升泛化效果。實務上需透過多次實驗來調整出最佳設定。

### 隨機遮蔽只能用於自監督學習嗎？

雖然隨機遮蔽在自監督學習中取得巨大成功，成為預訓練模型的關鍵，但其應用不僅限於此。在監督式學習中，它同樣可作為有效的資料增強與正則化技術。在模型進行預測前對輸入資料施加隨機遮蔽，能人為增加訓練樣本的多樣性。這迫使神經網路放棄過度依賴少數顯著特徵，轉而學習並整合更廣泛的上下文資訊。透過這種方式訓練的模型，在面對實際應用中可能出現的資料受損、感測器故障或背景雜訊時，往往能展現出更強大的抗干擾能力與穩定性。

### 隨機遮蔽如何幫助模型抵抗潛在的輸入雜訊？

隨機遮蔽透過改變訓練資料的分佈，有效提升了模型抵抗輸入干擾的能力。在一般訓練中，模型容易記住特定的局部特徵來預測，這種捷徑學習使其面對瑕疵資料時顯得脆弱。引入隨機遮蔽後，模型會反覆面臨核心特徵缺失的挑戰，迫使其發掘並利用其他具有預測價值的輔助資訊。這種訓練促使模型建立起多重且互補的特徵表示結構。因此，當實際應用中遇到部分資料受損或干擾時，已習慣不完整資訊的模型仍能穩定推斷，不再過度依賴單一特徵。

---

來源：https://aiterms.tw/terms/random-masking
快查頁：https://aiterms.tw/terms/random-masking
最後更新：2026/07/04
深度解說：https://aiterms.tw/learning/what-is-random-masking