---
title: "單類別支持向量機（One-Class SVM）"
slug: one-class-svm
language: zh-TW
source: https://aiterms.tw/learning/what-is-one-class-svm
updated_at: 2026-07-04
tags: [機器學習, 異常偵測, 統計方法, source:arxiv]
ipas_term: false
type: deep-dive
---

# 單類別支持向量機 是什麼？

> 單類別支持向量機為非監督式異常偵測演算法，利用正常樣本建立高維邊界，以分離出落於邊界之外的異常資料。

## 核心概念
單類別支持向量機（One-Class SVM, OCSVM）是一種非監督式學習演算法，主要用於異常偵測與新穎性偵測。傳統的支持向量機旨在尋找一個超平面來最大化兩個類別之間的邊界，單類別支持向量機則是尋找一個能夠包圍正常資料點的超球面或決策邊界，將正常資料點盡可能包含在內，同時將原點視為異常資料的代表。這個演算法將資料映射到高維特徵空間，並在此空間中尋找最大邊距的超平面，將資料點與原點分離。當新資料點被輸入模型時，若落在該邊界之外，即判定為異常資料；若落在邊界內，則視為正常資料。

此方法適用於只有正樣本可供訓練，或異常資料極度稀少且難以取得的工程情境。真實世界的異常事件通常缺乏代表性樣本，單類別支持向量機提供了有效的數學解決方案。透過引入核函數，演算法能夠處理非線性分佈的資料，在處理複雜高維資料時具有顯著的特徵捕捉能力。核函數將原始資料映射至更高維的空間，使得原本在低維空間難以線性分離的資料，在高維空間變得可以被超平面分離。常見核函數包括徑向基函數、多項式核函數與線性核函數，其中徑向基函數由於具備強大的非線性映射能力，在實務配置中最為常用。

模型訓練過程中引入了超參數 nu，此參數控制模型複雜度與容錯率。nu 參數既是訓練資料中被允許判定為異常的比例上限，也是支持向量比例的下限。調整 nu 的值可控制模型對異常資料的敏感度。較小的 nu 值使模型傾向包含更多訓練資料，形成寬鬆邊界；較大的 nu 值使模型變得嚴格，將更多邊緣正常資料點判定為異常。選擇合適的 nu 值與核函數參數對於模型效能至關重要，工程上需透過交叉驗證等嚴謹技術進行參數調校。

## 運作原理
單類別支持向量機的數學原理源自傳統支持向量機的延伸，最佳化目標是在高維特徵空間中尋找最優超平面，將正常資料點與原點分開，並使得超平面到原點的距離最大化。假設擁有一組全為正常樣本的訓練資料集，演算法首先透過非線性映射函數，將原始資料點從輸入空間轉換到特徵空間。在此特徵空間中建構的超平面方程式，可表示為權重向量與特徵向量的內積加上偏差項。

演算法的最佳化目標為最小化權重向量的範數，這等同於最大化超平面到原點的幾何距離，同時引入一組鬆弛變數來容許部分資料點落在超平面的錯誤側。鬆弛變數的總和受到使用者設定的 nu 參數控制。透過拉格朗日乘數法，有條件的最佳化問題轉換為對偶問題，使得系統可以在不直接計算高維特徵向量的情況下，透過核函數計算資料點之間的內積。這個核技巧是演算法能夠高效處理非線性資料的核心基礎。

求解對偶問題後可得到每個訓練資料點對應的拉格朗日乘數。拉格朗日乘數大於零的資料點稱為支持向量，這些支持向量決定了超平面的最終位置，通常位於邊界上或邊界之外。對於新的測試資料點，系統計算其與所有支持向量之間的核函數值，並透過決策函數判斷類別。決策函數計算結果大於或等於零，表示資料點位於正常資料區域；小於零則表示資料點位於原點側，判定為異常資料。

徑向基函數是最常被使用的核函數，其數學形式為高斯函數，用於計算資料點之間的相似度。徑向基函數包含參數 gamma，控制單個訓練樣本的影響範圍。較大的 gamma 值導致單個樣本影響範圍小，產生複雜且緊密包圍訓練資料的邊界，容易引發過度擬合問題；較小的 gamma 值使樣本影響範圍擴大，產生平滑且寬鬆的邊界。工程實作中必須反覆調整 gamma 與 nu 這兩個核心參數。

## 實際應用
單類別支持向量機在異常事件難以收集的工業場景中有著廣泛應用。在工業製造領域，這項技術被應用於機台設備的預測性維護。透過收集設備正常運轉時的感測器數據如震動、溫度與壓力，工程師可訓練模型建立正常運作狀態的數學基準線。當設備出現潛在故障或異常磨損，感測器數據偏離正常模式時，模型能偵測出微小變化並發出預警，協助降低非計畫性停機時間與後續維修成本。

在資訊安全領域，該演算法也是網路入侵偵測系統的技術基礎。正常的網路存取佔絕大多數，惡意攻擊相對稀少。分析正常網路封包特徵如連線時間、封包大小與通訊埠，可以建立正常網路行為模型。當遭遇未曾記錄的新型態網路攻擊時，只要其流量特徵與正常模式顯著不同，模型便能將其識別為異常活動，提升整體網路防禦系統的反應速度。

在金融服務業的信用卡詐欺偵測中，傳統二元分類模型面對極度不平衡的資料集時效能受限。單類別支持向量機利用持卡人過去的正常交易紀錄，如消費金額、地點與頻率，學習其個人消費行為模式。一旦出現與該持卡人日常行為模式差異過大的交易，模型會將其標記為可疑交易，觸發驗證機制以保障金融安全。

在醫療影像分析中，該模型協助辨識異常組織或病變。對於缺乏足夠病變影像資料的罕見疾病，研究人員利用大量健康醫學影像訓練模型。輸入新影像時，模型突顯出與正常組織結構不同的區域，為專業醫師提供進一步檢查的客觀參考，在腦部掃描腫瘤偵測與肺部異常識別等技術上具備實際應用價值。

## 常見誤區
應用單類別支持向量機時，工程團隊經常面臨數個導致模型效能不佳的誤區。一個常見誤解是認為該演算法適用於所有異常偵測任務。實際上，此模型在處理高維且特徵間存在複雜非線性關係的資料時表現較佳；面對低維或特徵分佈簡單的資料，較簡單的統計方法可能具備更低的運算成本與同等效能。選擇演算法前應根據資料的數學特性進行系統性評估。

參數調校不當是另一個嚴重誤區。未經仔細交叉驗證即使用 nu 與 gamma 的預設值，極易導致模型過度擬合或欠擬合。過度擬合將正常邊緣資料判定為異常，增加誤報率；欠擬合則使邊界過於寬鬆，無法識別真實異常，增加漏報率。建立嚴謹的參數網格搜尋流程是確保模型效能的必要步驟。

資料預處理的重要性經常被低估。單類別支持向量機基於距離運算，特徵的尺度大小對決策有絕對影響。不同特徵數值範圍差異過大會導致模型過度依賴大數值特徵，忽略小數值特徵。輸入資料前必須實施標準化或正規化處理，確保所有特徵在相同數學尺度下運算。

將模型用於包含大量雜訊的訓練資料也是技術風險。模型基本假設訓練資料主要由正常樣本組成，若混入過多異常樣本，演算法會試圖將雜訊包含在正常邊界內，扭曲正常資料的特徵表示，導致模型對新異常資料的鑑別力下降。訓練前應落實資料清洗，剔除明顯離群值。

## 與相關技術的比較
在異常偵測技術光譜中，單類別支持向量機與隔離森林在運作機制上有根本不同。隔離森林透過隨機選擇特徵並切分資料來孤立資料點，容易被孤立的資料點判定為異常。隔離森林處理大規模高維資料時運算效率較高，對特徵尺度變化不敏感；單類別支持向量機則透過核函數捕捉複雜非線性邊界，但在海量資料下運算時間與記憶體消耗會指數型增加。

與局部異常因子相比，局部異常因子透過計算局部密度並與鄰近點比較來識別異常，適合處理密度分佈不均勻的資料集。但局部異常因子對參數選擇敏感，且計算密度需遍歷資料集，易遭遇效能瓶頸。單類別支持向量機專注於尋找全局邊界，對全局性異常偵測有效，但在處理多個不同密度正常資料聚類時會面臨邊界劃分困難。

自編碼器在深度學習領域廣泛用於異常偵測，透過編碼與解碼網路學習正常資料特徵，異常資料輸入時產生較大重建誤差。自編碼器在影像與音訊等非結構化資料上具備特徵提取優勢，但模型複雜、訓練時間長且缺乏清晰的幾何解釋。單類別支持向量機在處理中小型結構化資料時，提供更穩定與具解釋性的數學結果。

與傳統二元支持向量機相比，二元模型需要充足的正負樣本以尋找分類超平面。單類別模型則專注界定單一類別範圍，不依賴負樣本訓練，適用於異常資料稀缺或無法預先定義的工程場景。兩者皆應用支持向量與核函數概念，但最佳化目標與適用領域截然不同。

## 常見問題

### 單類別支持向量機是否能夠處理包含多個特徵的高維度資料？

單類別支持向量機具備處理高維度資料的優異能力，這主要歸功於核技巧在數學上的應用。在面對多維特徵時，線性模型往往難以找出有效的決策邊界，而單類別支持向量機可透過徑向基函數等核函數，將原始的低維度特徵空間映射至維度更高甚至無限維的特徵空間。在這種轉換之下，原本難以劃分的非線性資料分佈會變得能夠被超平面或超球面有效隔離。因此，即使資料集包含數十至數百個工程特徵，演算法依然能精準包圍正常資料點。值得注意的是，在處理高維度資料前，必須實施嚴格的特徵標準化程序，以防止不同尺度的特徵干擾距離計算的準確性，進而確保模型維持穩定的偵測效能。

### 在模型訓練階段，如果訓練資料中混入了少量的異常值，會對演算法造成什麼具體影響？

單類別支持向量機的核心假設是訓練資料皆為正常樣本，若訓練資料集中混入了少量的異常值或雜訊，模型的邊界判定效能將會受到干擾。演算法在學習過程中，會試圖將這些包含異常值的資料點也納入正常邊界的保護範圍內，導致學習到的特徵分佈被扭曲。這種情況會使得最終生成的決策邊界過於寬鬆，進而增加系統在實際部署後的漏報率，無法準確辨識出真正的異常事件。為了解決這項工程挑戰，必須透過仔細調校超參數 nu 來應對。合理設定的 nu 值可以賦予模型一定的容錯能力，允許演算法主動忽略位於分佈邊緣的少數離群資料，從而建立出更強健且符合真實正常行為的幾何決策邊界。

### 單類別支持向量機與基於深度學習的異常偵測方法相比，在工程選擇上有何差異？

單類別支持向量機屬於基於統計與幾何計算的傳統機器學習演算法，其數學基礎明確，對於中小型結構化資料集具有良好的運算效率與極高的可解釋性。在模型需要進行嚴格審計或解釋決策邏輯的工業場景中具有優勢。相對而言，自編碼器等基於深度學習的方法，透過多層神經網路自動學習深層特徵，在處理如影像、音訊等高維度非結構化資料時表現出色。然而，深度學習架構通常需要龐大的運算資源與較長的訓練時間，且其內部神經網路的運作機制猶如黑盒子，決策透明度較低。在實務的工程架構選擇上，開發團隊應根據資料的規模、維度特性、硬體資源限制以及對模型可解釋性的要求，來決定採用何種技術方案。

---

深度解說頁：https://aiterms.tw/learning/what-is-one-class-svm
快查頁：https://aiterms.tw/terms/one-class-svm
最後更新：2026/07/04