什麼是 AI偏見（Bias in AI）？

AI偏見是指AI系統在訓練或決策過程中，由於資料、演算法或人為因素，產生不公平或歧視性的結果。

核心概念

AI偏見是指AI系統在學習和決策過程中，由於各種因素，產生不公平、不準確或歧視性的結果。這種偏見可能源於多個方面，包括但不限於：

資料偏見 (Data Bias): 訓練資料未能充分代表真實世界的分布，導致模型學習到有偏差的模式。例如，如果一個人臉辨識系統的訓練資料主要包含特定種族的人臉，那麼它可能對其他種族的人臉辨識效果較差。
演算法偏見 (Algorithmic Bias): 演算法本身的設計或參數設定可能導致偏見。例如，某些演算法可能對特定類型的輸入更加敏感，從而產生不公平的結果。
人為偏見 (Human Bias): 開發者在資料收集、標籤或模型設計過程中引入的偏見。例如，如果開發者對某些群體持有刻板印象，那麼他們可能會在不知不覺中將這些偏見融入到AI系統中。
抽樣偏見 (Sampling Bias): 訓練資料的抽樣方式不具代表性，導致模型學習到錯誤的模式。例如，如果一個關於客戶滿意度的調查只針對特定地區的客戶，那麼它可能無法反映所有客戶的真實感受。
測量偏見 (Measurement Bias): 用於測量或評估模型性能的指標本身存在偏見。例如，如果一個用於評估招聘系統的指標只考慮特定技能，那麼它可能會忽略其他重要的技能。

運作原理

AI偏見的產生通常是一個複雜的過程，涉及多個階段：

資料收集: 資料收集是AI系統的第一步，也是偏見產生的重要源頭。如果收集到的資料未能充分代表真實世界的分布，那麼模型將會學習到有偏差的模式。
資料預處理: 在資料預處理階段，開發者可能會對資料進行清洗、轉換或增強。如果在這個過程中引入了偏見，那麼它將會影響模型的性能。
模型訓練: 模型訓練是AI系統的核心，也是偏見產生的另一個重要源頭。如果訓練資料存在偏見，或者演算法本身存在缺陷，那麼模型將會學習到有偏差的模式。
模型評估: 模型評估是用於衡量模型性能的過程。如果評估指標本身存在偏見，那麼它可能會掩蓋模型的偏見。
模型部署: 模型部署是將AI系統應用於實際場景的過程。如果在部署過程中沒有充分考慮偏見問題，那麼它可能會對特定群體造成傷害。

實際應用

AI偏見可能出現在各種AI應用中，包括但不限於：

招聘: AI系統被用於篩選履歷、評估候選人，但如果訓練資料存在偏見，那麼它可能會對特定群體造成歧視。
信貸: AI系統被用於評估信用風險，但如果訓練資料存在偏見，那麼它可能會對特定群體造成不公平的待遇。
刑事司法: AI系統被用於預測犯罪風險，但如果訓練資料存在偏見，那麼它可能會對特定群體造成不公正的判決。
醫療保健: AI系統被用於診斷疾病、制定治療方案，但如果訓練資料存在偏見，那麼它可能會對特定群體造成誤診或誤治。
內容推薦: AI系統被用於推薦新聞、商品、影片，但如果演算法存在偏見，那麼它可能會加劇社會分化。

常見誤區

認為AI是客觀的: 很多人認為AI是客觀的，不會受到人類偏見的影響。但事實上，AI系統是由人類設計和訓練的，因此不可避免地會受到人類偏見的影響。
認為只要有足夠的資料，就可以消除偏見: 雖然更多的資料可以幫助減少偏見，但如果資料本身存在偏見，那麼再多的資料也無法完全消除偏見。
認為只要使用公平的演算法，就可以避免偏見: 即使使用公平的演算法，如果訓練資料存在偏見，那麼模型仍然可能產生有偏差的結果。
認為偏見只會影響特定群體: 偏見可能會影響所有人，只是影響程度不同而已。

與相關技術的比較

公平性 (Fairness): 公平性是指AI系統對不同群體或個體產生公平的結果。AI偏見是影響公平性的重要因素。
可解釋性 (Explainability): 可解釋性是指AI系統的決策過程可以被理解和解釋。可解釋性有助於發現和消除AI偏見。
透明度 (Transparency): 透明度是指AI系統的設計和運作方式是公開和透明的。透明度有助於提高AI系統的可靠性和安全性。
穩健性 (Robustness): 穩健性是指AI系統在面對不同環境或輸入時，仍然能夠保持良好的性能。穩健性有助於減少AI偏見的影響。

相關術語

相關術語

常見問題

← 回到 AI偏見快查頁

延伸學習

想看 AI偏見的完整影片教學？前往美第奇 AI 學院