什麼是資料投毒攻擊（Data Poisoning）？

資料投毒攻擊是一種惡意攻擊，攻擊者將惡意或錯誤的資料注入到訓練資料集中，以影響機器學習模型的性能或行為。攻擊目標是使模型產生錯誤的預測或執行其他有害操作。

核心概念

資料投毒攻擊的核心概念是通過操縱訓練資料來影響機器學習模型的學習過程。攻擊者將精心設計的惡意資料注入到訓練集中，使得模型在訓練過程中學習到錯誤的模式，從而導致模型在部署後產生錯誤的預測或執行其他有害操作。

關鍵要素：

資料投毒攻擊通常包含以下步驟：

資料收集： 攻擊者需要收集或生成與目標模型訓練資料相似的資料。攻擊者可能需要了解目標模型的訓練資料的分佈和特徵。
投毒資料生成： 攻擊者設計惡意的投毒資料，這些資料旨在影響模型的學習過程。投毒資料的設計取決於攻擊者的目標，例如，使模型將特定類別的資料錯誤分類，或者使模型產生特定的輸出。
資料注入： 攻擊者將投毒資料注入到訓練資料集中。攻擊者可能需要通過各種手段來實現資料注入，例如，通過網路爬蟲收集資料並將投毒資料混入其中，或者通過入侵資料庫來直接修改訓練資料。
模型訓練： 使用包含投毒資料的訓練資料集來訓練目標模型。模型在訓練過程中會學習到投毒資料中的錯誤模式。
攻擊執行： 模型部署後，攻擊者可以利用模型中的錯誤模式來實現其攻擊目標。例如，攻擊者可以向模型輸入特定的資料，使得模型產生錯誤的預測，或者執行其他有害操作。

詳細步驟：

投毒策略設計： 攻擊者需要設計有效的投毒策略，以確保投毒資料能夠成功地影響模型的學習過程。常用的投毒策略包括：
- 標籤翻轉： 將一部分訓練資料的標籤翻轉，例如，將正例標記為負例，或者將負例標記為正例。
- 後門注入： 在訓練資料中注入一些帶有特定觸發器的資料，使得模型在遇到這些觸發器時產生特定的輸出。
- 噪聲注入： 在訓練資料中注入隨機噪聲，以降低模型的準確性。
注入比例控制： 攻擊者需要控制投毒資料的注入比例，以避免被檢測到。如果投毒比例過高，則可能會引起懷疑，並導致模型訓練失敗。通常，攻擊者會選擇一個較小的投毒比例，以確保攻擊的隱蔽性。
攻擊目標選擇： 攻擊者需要選擇明確的攻擊目標，例如，使模型將特定類別的資料錯誤分類，或者使模型產生特定的輸出。攻擊目標的選擇取決於攻擊者的意圖和目標模型的應用場景。

資料投毒攻擊在多個領域都具有潛在的應用，包括：

誤區一：資料投毒攻擊只能攻擊公開的模型。
- 事實：資料投毒攻擊也可以攻擊私有的模型，只要攻擊者能夠影響模型的訓練資料。
誤區二：資料投毒攻擊很容易被檢測到。
- 事實：如果攻擊者設計了有效的投毒策略，並控制了投毒比例，則資料投毒攻擊可能很難被檢測到。
誤區三：資料投毒攻擊只能影響模型的準確性。
- 事實：資料投毒攻擊不僅可以影響模型的準確性，還可以影響模型的其他性能指標，例如，模型的公平性和魯棒性。
誤區四：資料清洗可以完全防止資料投毒攻擊。
- 事實：資料清洗可以降低資料投毒攻擊的風險，但不能完全防止攻擊。攻擊者可以通過精心設計投毒資料來繞過資料清洗機制。

防禦方法：

總之，資料投毒攻擊是一種嚴重的安全威脅，需要採取有效的防禦措施來保護機器學習模型的安全。

延伸學習

想看資料投毒攻擊的完整影片教學？前往美第奇 AI 學院