---
title: "圖分類（Graph Classification）"
slug: graph-classification
language: zh-TW
source: https://aiterms.tw/learning/what-is-graph-classification
updated_at: 2026-07-04
tags: [知識圖譜, 神經網路, 深度學習, source:arxiv]
ipas_term: false
type: deep-dive
---

# 圖分類 是什麼？

> 圖分類是將整個圖形結構映射到特定類別的機器學習任務，旨在根據節點、邊及整體拓撲特徵預測圖形的屬性或狀態。

## 核心概念

圖分類（Graph Classification）是圖神經網路與圖機器學習領域中的一個核心任務。在傳統的機器學習任務中，資料通常被表示為固定長度的向量或具有規則排列的網格狀結構，例如影像的像素陣列。然而，現實世界中有大量資料呈現不規則的網路結構，包含節點與連接節點的邊，例如化學分子、社交網路互動、大腦神經連結以及程式控制流程圖。圖分類的目標，便是建立一種運算模型，能夠接收這類不規則的圖形資料作為輸入，並預測出該完整圖形所屬的類別標籤。

在這個過程中，模型不僅需要考慮個別節點自身的屬性特徵，還必須充分理解節點之間的連結模式與整體的拓撲結構。因為圖形的宏觀屬性往往是由微觀的結構排列所決定。圖分類模型的本質是學習一個映射函數，將一個離散的、大小不一的圖結構空間，轉換到連續的向量空間中，產生一個能代表整張圖特徵的圖嵌入向量，最後再依據這個向量進行分類決策。

要達成這項目標，圖分類系統必須具備排列不變性。因為同一個圖結構可以透過不同的節點排列順序來表示其鄰接矩陣與特徵矩陣，一個健全的圖分類模型必須確保，無論節點的排列順序如何改變，只要圖形的本質結構相同，最後輸出的圖嵌入向量與分類結果都必須保持一致。這種對排列的不變性是圖分類技術區別於傳統序列處理或影像處理的關鍵特徵之一。

## 運作原理

圖分類模型的運作原理通常可以分為幾個主要階段，包含節點特徵提取、訊息傳遞與特徵聚合、圖形級別池化以及最終的分類預測。

在特徵提取階段，模型會先初始化圖中每個節點的特徵向量。這些初始特徵可能來自節點自身的屬性資料，例如在化學分子圖中，節點代表原子，其初始特徵可能包含原子序、電荷量或原子量等資訊。若是沒有額外的屬性資料，模型也可以利用節點的結構特徵，例如節點的分支度或網路中心性指標作為初始輸入。

接著進入訊息傳遞與特徵聚合階段，這通常是透過多層的圖卷積網路或其他圖神經網路架構來實現。在每一層的神經網路中，每個節點會收集來自其相鄰節點的特徵資訊，並將這些相鄰節點的資訊與自身的特徵進行融合，以更新自己的特徵表示。隨著網路層數的增加，節點所能感受到的局部結構範圍也會逐漸擴大，從一開始的直接相鄰節點，擴展到距離更遠的鄰居。這使得每個節點最終的特徵向量不僅包含了自身的屬性，也蘊含了其所在位置周遭的拓撲結構資訊。

完成多層的訊息傳遞後，圖中每個節點都獲得了豐富的局部特徵表示。然而，圖分類的目標是預測整張圖的類別，因此必須進入第三個階段，也就是圖形級別的池化。池化層的作用是將圖中所有節點的特徵向量匯總成單一個固定維度的向量，這個向量被稱為圖表示向量。常見的池化方法包含簡單的全域平均池化或全域最大池化，這些方法運算速度快且符合排列不變性的要求。為了捕捉更複雜的階層式結構，研究者也發展出各種分層池化技術，例如透過節點分群演算法，將圖形逐漸粗粒化，最後再整合成單一向量。

最後，在分類預測階段，模型會將池化後得到的圖表示向量輸入到傳統的全連接神經網路分類器中。分類器會計算該向量屬於各個預先定義類別的機率分佈，並輸出機率最高的類別作為圖分類的最終結果。整個模型通常透過反向傳播演算法與梯度下降法，並以真實的圖形標籤計算損失函數來進行端到端的訓練。

## 實際應用

圖分類技術在眾多領域都有著廣泛且深遠的應用價值，特別是在那些資料本質上呈現複雜關聯性的科學與工程問題中。

在化學與藥物開發領域，圖分類被大量應用於分子屬性預測。化學分子可以自然地表示為圖結構，其中原子為節點，化學鍵為邊。透過圖分類模型，研究人員可以預測一個未知分子是否具有某種特定的生物活性、毒性、或是水溶性。藉由在模型中輸入分子結構圖，系統能直接輸出屬性類別，輔助研究人員挑選出具備潛力的合成標的。

在生物資訊學方面，圖分類常被用來分析蛋白質結構。蛋白質可以視為由胺基酸節點與其空間接觸邊緣所構成的圖形。圖分類模型可以根據蛋白質的三維結構特徵，預測其所屬的酶類別或生物學功能。這對於理解疾病機制以及設計新型生物製劑具有重要的意義。

在網路安全與系統分析領域，軟體程式碼的執行流程可以被轉換為控制流程圖或資料流程圖。圖分類技術可透過分析這些程式碼圖形結構，自動偵測出其中是否隱藏著惡意程式碼或潛在的系統漏洞。

## 常見誤區

在應用圖分類技術時，開發者常會面臨一些觀念上的誤區與實作上的陷阱。

其中一個常見的誤區是過度依賴深層的圖神經網路。在處理影像識別時，增加卷積神經網路的層數通常能提升模型捕捉複雜特徵的能力。然而，在圖分類中，過深的網路結構容易引發過度平滑現象。當圖神經網路的層數過多時，訊息會在圖中過度傳播，導致幾乎所有節點最終都獲得相似的特徵表示，失去了對圖形局部獨特結構的辨識能力。這反而會嚴重降低圖分類模型的準確度。因此，選擇合適的網路層數，或引入殘差連接與跳躍連接機制，是避免過度平滑的關鍵。

另一個誤區是在池化階段過度簡化圖形結構。許多早期的圖分類模型採用簡單的全域平均池化將所有節點特徵相加平均。這種做法雖然計算效率高，但卻完全忽略了圖形中節點的層次結構與群體特徵。例如，在化學分子中，某些官能基的組合對於分子屬性具有決定性的影響。如果僅使用簡單的全域池化，這些重要的局部子圖特徵可能會在平均的過程中被稀釋掉。為了解決這個問題，設計能夠感知圖形拓撲結構的分層池化機制是目前領域內的重要發展方向。

此外，許多使用者在處理圖形資料時，會忽略圖形本身可能存在的雜訊與不完整性。真實世界的圖形資料，例如社交網路或生物網路，往往包含許多錯誤的邊連接或遺失的節點資訊。如果將這些充滿雜訊的圖形直接送入模型訓練，會導致模型學習到錯誤的結構特徵。因此，在進行圖分類之前，執行適當的圖資料清理與特徵工程，例如移除孤立節點、過濾低置信度的邊連接，是提升模型穩健性不可或缺的步驟。

## 與相關技術的比較

圖分類與許多傳統或新興的機器學習技術在概念與應用上既有重疊之處，也存在顯著的差異。

相較於節點分類，兩者的核心差異在於預測的目標層級不同。節點分類是在一個已知的圖結構中，預測其中部分未知節點的屬性標籤。例如在引文網路中預測某篇論文所屬的研究領域。在此任務中，模型的輸出是對應每個節點的分類結果。而圖分類則是面對多個獨立的圖結構，需要為每一個完整的圖形分配一個標籤。這意味著圖分類模型必須具備將整個圖形壓縮為單一表示的能力，這是節點分類所不需要的。

與傳統的機器學習方法（如隨機森林或支持向量機）相比，圖分類技術在處理不規則結構資料時展現出明顯的優勢。傳統方法通常需要大量的人工特徵工程來將圖結構轉換為固定長度的特徵向量，例如計算圖的各種統計量或子圖出現頻率。這種轉換過程不僅耗時，而且容易流失圖形原本豐富的拓撲資訊。圖分類模型，特別是基於深度學習的圖神經網路，能夠直接在圖結構上進行端到端的特徵學習，自動捕捉節點特徵與結構特徵之間的非線性關係，從而在許多複雜任務中達到較高的預測準確率。

在與卷積神經網路的比較上，雖然兩者都使用了局部訊息聚合的概念，但應用場景有根本的差異。卷積神經網路專為處理具有規則網格結構的資料（如二維影像的像素排列）而設計，其卷積核在影像上滑動時，處理的是固定數量的相鄰像素。然而，圖分類技術所處理的圖形資料是不規則的，每個節點的相鄰節點數量可能都不一樣，且節點之間沒有固定的空間順序。因此，圖分類必須依賴圖神經網路中針對不規則結構設計的訊息傳遞機制，以確保運算過程不受節點排列順序的影響。

## 常見問題

### 圖分類與節點分類有什麼主要差異？

圖分類的目標是預測整張圖的標籤，例如判斷一個分子結構是否具有毒性；而節點分類則是預測單一圖結構內各個節點的標籤，例如在社交網路中預測個別使用者的興趣或職業。圖分類需要將圖中所有節點與邊的資訊整合出單一的圖層級表示向量，通常需要使用池化機制來彙總局部特徵，這是節點分類所不需要的步驟。兩者雖都處理圖形資料，但在特徵聚合與預測層級上有著根本上的不同。

### 進行圖分類任務時，如何處理不同大小與形狀的圖形輸入？

現實世界中的圖結構往往具有不同的節點數量與連結模式，處理這些變動大小的輸入是圖分類的一大挑戰。通常會採用圖神經網路來提取各節點的特徵，接著透過全域池化層（例如全域平均池化或全域最大池化）將變動數量的節點特徵壓縮成固定維度的向量。這種機制確保了後續分類層能夠接收到一致大小的輸入特徵，同時保留了原始圖形的拓撲與屬性資訊，使模型具備處理任意大小圖形的能力。

### 圖分類在訓練過程中常遇到哪些挑戰？如何解決？

圖分類常見的挑戰包括圖結構的同構問題，也就是結構相同但節點排列不同的圖形可能導致模型輸出不一致。此外，過度平滑問題也容易在多層圖神經網路中發生，導致不同類別的圖特徵變得難以區分。為解決這些問題，研究人員會引入更靈活的池化方法（如分層池化）、加入注意力機制以聚焦重要節點，或者採用資料擴增技術（如隨機丟棄邊或遮蔽節點）來提升模型的泛化能力與穩健性。

---

深度解說頁：https://aiterms.tw/learning/what-is-graph-classification
快查頁：https://aiterms.tw/terms/graph-classification
最後更新：2026/07/04