奇異值分解（Singular Value Decomposition）

奇異值分解（SVD）是一種將矩陣分解為三個矩陣乘積的技術，廣泛應用於降維、推薦系統和資料壓縮等領域。

完整說明

核心概念

奇異值分解 (Singular Value Decomposition, SVD) 是一種強大的線性代數技術，用於將任何矩陣分解為三個更簡單的矩陣的乘積。這三個矩陣分別代表原始矩陣的不同面向，揭示了其底層結構和重要特徵。

矩陣分解： 將一個矩陣表示為兩個或多個矩陣的乘積。SVD 是一種特殊的矩陣分解方法。
奇異值： 對角矩陣 Σ 中的元素，表示原始矩陣在不同方向上的能量或重要性。奇異值越大，對應的特徵向量越重要。
奇異向量： 矩陣 U 和 V 的列向量，分別稱為左奇異向量和右奇異向量。它們是原始矩陣的特徵向量，描述了原始矩陣的主要方向。
正交矩陣： 一個矩陣，其轉置等於其逆矩陣。正交矩陣的列向量是單位向量，且彼此正交。
對角矩陣： 一個矩陣，其非對角線上的元素都為零。

運作原理

對於任意一個 m x n 的矩陣 A，SVD 可以將其分解為以下形式：

A = UΣVᵀ

其中：

U 是一個 m x m 的正交矩陣，其列向量是 AAT 的特徵向量（左奇異向量）。
Σ 是一個 m x n 的對角矩陣，其對角線上的元素是 A 的奇異值，通常按降序排列。
V 是一個 n x n 的正交矩陣，其列向量是 ATA 的特徵向量（右奇異向量）。

計算步驟：

計算 AAT 和 ATA： 分別計算矩陣 A 與其轉置的乘積。
計算 AAT 和 ATA 的特徵值和特徵向量： 使用特徵值分解方法計算 AAT 和 ATA 的特徵值和特徵向量。
構造 U、Σ 和 V：
- U 的列向量是 AAT 的特徵向量（左奇異向量）。
- Σ 的對角線上的元素是 AAT 或 ATA 的特徵值的平方根（奇異值），並按降序排列。
- V 的列向量是 ATA 的特徵向量（右奇異向量）。
驗證分解： 驗證 UΣVᵀ 是否等於原始矩陣 A。

降維：

SVD 的一個重要應用是降維。由於奇異值按降序排列，我們可以選擇前 k 個最大的奇異值及其對應的奇異向量來近似原始矩陣。這相當於保留了原始矩陣中最重要的信息，同時降低了數據的維度。

A ≈ UkΣkVkᵀ

其中：

Uk 是 U 的前 k 列。
Σk 是 Σ 的前 k 個奇異值組成的 k x k 對角矩陣。
Vk 是 V 的前 k 列。

實際應用

SVD 在許多領域都有廣泛的應用，包括：

推薦系統： 用於協同過濾，根據用戶的歷史行為預測用戶可能感興趣的商品或服務。
影像處理： 用於影像壓縮、去噪和特徵提取。
自然語言處理： 用於文本分析、主題建模和語義分析。
資料壓縮： 通過保留最重要的奇異值和奇異向量來降低數據的存儲空間。
降維： 降低數據的維度，簡化模型，提高計算效率。
基因表達分析： 識別基因表達數據中的重要模式。
金融分析： 用於風險管理和投資組合優化。

案例：推薦系統

在推薦系統中，SVD 可以用於分解用戶-物品評分矩陣。該矩陣的每一行代表一個用戶，每一列代表一個物品，矩陣中的元素表示用戶對物品的評分。通過對該矩陣進行 SVD 分解，可以得到用戶和物品的隱藏特徵向量。然後，可以使用這些特徵向量來預測用戶對未評分物品的評分，並向用戶推薦他們可能感興趣的物品。

常見誤區

SVD 與特徵值分解 (Eigenvalue Decomposition) 的混淆： SVD 適用於任何矩陣，而特徵值分解僅適用於方陣。
認為 SVD 只能用於降維： 雖然降維是 SVD 的一個重要應用，但它也可以用於其他目的，例如資料壓縮、推薦系統和影像處理。
忽略奇異值的意義： 奇異值表示原始矩陣在不同方向上的能量或重要性。忽略奇異值會導致信息丟失。
錯誤地選擇降維的維度 k： 選擇過小的 k 會導致信息丟失，選擇過大的 k 會導致降維效果不明顯。需要根據具體問題選擇合適的 k 值。
認為 SVD 是一種黑盒方法： 理解 SVD 的原理對於正確使用和解釋其結果至關重要。

相關術語

相關術語

常見問題

延伸學習

深入了解奇異值分解的完整運作原理

延伸學習

想看奇異值分解的完整影片教學？前往美第奇 AI 學院