直接侵權是什麼？

Direct Infringement — 直接侵權的完整解釋

直接侵權指未經授權而直接複製、散布或使用受版權保護作品的行為，在AI領域涉及模型訓練與輸出。

核心概念

直接侵權（Direct Infringement）在著作權法中是指未經著作權人授權，直接實施著作權法所規定的專有權利行為，例如複製、散布、公開展示、公開演出或改作受保護的作品。這種侵權行為的特點是侵權人直接從事了構成侵權的行為，無需證明其知道或應當知道該作品受著作權保護，也無需證明其意圖侵權。只要行為客觀上侵犯了著作權人的專有權利，就可能構成直接侵權。在AI領域，直接侵權的概念變得更加複雜且具有挑戰性。主要體現在兩個方面：

AI模型訓練資料的侵權：當AI模型使用受著作權保護的資料進行訓練時，如果這些資料的獲取、複製或處理未經著作權人授權，就可能構成直接侵權。例如，未經許可抓取大量受版權保護的圖像、文本或音樂用於訓練資料集。
AI模型生成內容的侵權：AI模型，特別是生成式AI模型，其輸出內容可能與現有受著作權保護的作品高度相似，甚至直接複製了原作品的實質性部分。這種情況下，AI模型的輸出行為可能被視為直接侵權。

運作原理

直接侵權的判斷通常需要滿足幾個要素：

存在有效的著作權：被侵權的作品必須是受著作權法保護的，且著作權仍然有效。
侵權人接觸過原作品：雖然不總是必須，但在許多情況下，證明侵權人有機會接觸到原作品有助於證明其複製行為。
實質性相似：侵權作品與原作品之間必須存在實質性相似。這不僅指表面上的相似，更重要的是作品中受保護的表達方式是否被複製。在AI領域，這可能涉及模型在訓練過程中「記憶」並重現了訓練資料中的特定受版權內容，或者生成內容與現有作品在表達上高度雷同。
未經授權：侵權行為必須是未經著作權人許可或法律豁免（如合理使用）的情況下發生的。

在AI模型訓練的背景下，當開發者收集和處理大量數據以訓練模型時，如果這些數據包含受著作權保護的內容，並且這些內容的複製行為未經授權，則可能構成直接侵權。例如，將數百萬張受版權保護的圖片複製到伺服器上用於訓練圖像識別模型，即使最終模型不直接輸出這些圖片，其訓練過程中的複製行為本身也可能被視為侵權。對於AI生成內容，判斷直接侵權則更具挑戰性。如果一個大型語言模型（LLM）在生成文本時，直接輸出了某本小說的完整段落，或者一個圖像生成模型生成了一幅與某知名藝術家作品幾乎一模一樣的圖像，這就可能構成直接侵權。關鍵在於判斷AI的輸出是否「實質性相似」於受保護的原作品，以及這種相似性是否源於對原作品的「複製」而非獨立創作。

實際應用

直接侵權在AI領域的實際應用案例和潛在風險日益增多：

大型語言模型（LLMs）的訓練資料：許多LLMs在訓練時會抓取網路上的海量文本數據，其中可能包含個人資訊、專有內容或受版權保護的文本。這些數據的複製和處理行為，如果沒有獲得著作權人的明確授權，可能面臨直接侵權的指控。例如，一些作者和出版社已對AI公司提起訴訟，聲稱其作品被用於訓練LLMs而未經許可。
圖像生成模型：當圖像生成模型（如Stable Diffusion, Midjourney）被用於生成特定風格或內容的圖像時，有時會生成與現有藝術作品、攝影作品高度相似的圖像。如果這些生成圖像被認定為對原作品的實質性複製，則可能構成直接侵權。藝術家們已對此類模型提出版權訴訟。
音樂生成與音訊複製：AI音樂生成器可能會在訓練後產生與現有歌曲旋律、和弦或歌詞高度相似的作品。如果這種相似性達到實質性複製的程度，則可能侵犯原歌曲的著作權。
程式碼生成工具：AI程式碼助手在生成程式碼時，有時會直接複製開源或專有程式碼庫中的片段。如果這些片段受著作權保護且未遵守相應許可證，則可能構成侵權。
深度偽造（Deepfakes）：雖然深度偽造主要涉及肖像權和名譽權，但如果其使用的原始圖像或影片素材受著作權保護，且未經授權，則也可能涉及直接侵權。

常見誤區

在AI與直接侵權的討論中，存在一些常見的誤區：

誤以為「機器學習」自動豁免侵權：許多人認為，由於AI模型是「學習」而非「複製」，因此其訓練過程或輸出不應被視為侵權。然而，著作權法關注的是客觀行為，即是否實施了著作權人的專有權利。即使是機器學習，其訓練資料的複製行為仍需遵守著作權法。
將「合理使用」原則過度擴大：合理使用（Fair Use）是著作權法中的一項重要抗辯理由，允許在特定條件下未經許可使用受版權保護的作品。但合理使用的判斷非常複雜，需要綜合考量使用目的和性質、作品性質、使用部分的數量和實質性、以及對潛在市場的影響。AI訓練資料的「大規模複製」是否符合合理使用，在法律界仍存在爭議，並非所有情況都能自動適用。
認為只要不直接「銷售」就不是商業用途：商業用途的定義比單純的銷售更廣泛。即使AI模型或其應用不直接銷售，但如果它間接為企業帶來經濟利益（例如提高效率、吸引用戶），也可能被視為商業用途，進而影響合理使用或特定許可證（如創用CC的非商業性條款）的適用性。
忽略「實質性相似」的複雜性：判斷AI生成內容與原作品是否實質性相似，不僅僅是肉眼可見的相似度。它還涉及對作品中受保護的創意表達的分析。即使AI生成內容經過一定程度的轉換，如果其核心創意表達與原作品高度雷同，仍可能構成侵權。
認為AI生成內容自動擁有著作權：目前大多數國家的著作權法要求作品必須由人類創作才能獲得著作權。AI生成的內容，如果缺乏人類的實質性參與，可能無法獲得著作權保護，這也意味著其無法成為被侵權的客體，也無法成為著作權人。

與相關技術的比較

直接侵權與其他相關法律概念和AI技術有著重要的區別和聯繫：

與間接侵權的比較：直接侵權是指直接實施著作權專有權利的行為。間接侵權（如輔助侵權或替代責任侵權）則是指雖然沒有直接實施侵權行為，但卻促成、教唆或從侵權行為中獲利，且對侵權行為有控制能力的行為。例如，一個平台明知用戶上傳侵權內容卻不採取行動，可能構成間接侵權。在AI領域，開發者訓練模型可能構成直接侵權，而提供侵權模型給用戶使用的平台則可能涉及間接侵權。
與合理使用的關係：合理使用是直接侵權的抗辯理由。如果AI模型對受著作權保護內容的使用被認定為合理使用，則即使存在複製行為，也不構成侵權。然而，合理使用的判斷標準在AI背景下仍不明確，特別是對於大規模資料集訓練。
與生成式AI的關係：生成式AI模型是直接侵權風險最高的AI技術之一。其「生成」的特性使其可能在無意中複製訓練資料中的受保護內容。這要求生成式AI的開發者和使用者必須對訓練資料的版權狀況和模型輸出的潛在侵權風險保持高度警惕。
與資料處理技術的關係：AI訓練通常涉及大量的資料收集、清洗、轉換和儲存。這些資料處理環節中的任何一步，如果涉及未經授權的受著作權保護內容的複製，都可能構成直接侵權。因此，資料治理、版權審查和許可證管理在AI資料處理中至關重要。
與AI倫理的關係：直接侵權不僅是法律問題，也是重要的AI倫理議題。尊重著作權、避免侵權是負責任AI開發和部署的基本倫理原則。開發者有責任確保其AI系統在整個生命週期中遵守著作權法規，避免不當利用他人的創作成果。

直接侵權在 iPAS 考試中的重點

根據歷年統計，直接侵權相關題目屬於未分類考範圍。

常見問題

資料來源

iPAS AI 應用規劃師評鑑內容範圍參考（115.02） — 經濟部產業人才能力鑑定

← 回到直接侵權快查頁

測驗你對直接侵權的理解

透過模擬考系統檢驗學習成果

開始測驗

直接侵權 是什麼？