從活字印刷到生成式AI：著作權制度的動態平衡之路

2026/06/27

◎賴文智律師

前一陣子打開社群媒體，幾乎都是吉卜力風格的圖像洗版，使用者簡單上傳一張照片，幾秒鐘就能生成宮崎駿筆觸的畫面。對許多人而言，這似乎只是好玩的科技現象，與「著作權」這個略顯嚴肅的法律議題沾不上邊。然而，從著作權實務工作者的角度來看，這波熱潮背後牽動的，其實是著作權制度三百多年來不斷面對、卻從未真正解決的核心問題：當創作的門檻被技術一再打破，法律應該如何因應？

要回答這個問題，與其直接跳進生成式AI的技術細節，不如先回頭看看著作權制度是怎麼一路走到今天的。因為，幾乎每一次重大的技術變革，都曾經讓著作權法經歷類似的衝擊與調整—這次的生成式AI技術，並不是第一次，但很可能是衝擊最大的一次。

一、著作權法從來不是只為了保護作者

(一) 印刷術與公會壟斷的起點

西元1456年，古騰堡利用金屬活字印刷術印製出第一批聖經，開啟了印刷術商業應用的時代。但活字印刷投入成本不低，出版業者很快組成公會，非公會成員不得從事印刷，公會成員之間也不允許技術外流。英國皇室為了打破歐陸公會制度對印刷技術的封鎖壟斷，反而給予「偷」走技術的人專營特許，作為吸引歐洲大陸能工巧匠的手段——這個邏輯，其實與後來的專利制度同出一源。到了十六、十七世紀，印刷特許權的性質又有了轉變，印刷公會開始透過管制成員出版品的「授權法案」，掌握對言論與出版的實質控制。

(二) 安妮法案：用「對作者權利保護」包裝的妥協

隨著英國國會勢力興起，社會對皇室透過印刷公會箝制言論的作法日益不滿，加上印刷技術發展已逾兩百年，國會在西元1694年拒絕再更新授權法案。印刷公會於是改變遊說策略，轉而強調應該保護作者及讀者的權利，讓作者對自己的創作享有財產權保護，藉以鼓勵持續創作——西元1709年國會通過、1710年公布的《安妮法案》，就是在這樣的背景下誕生。值得注意的是，印刷公會為了延續自身既得利益，特意在安妮法案中埋下「著作權可以自由轉讓」的伏筆。換言之，著作權制度從一開始，就不是單純為了保護作者而設計，而是商業利益重新包裝後的產物。

(三) 攝影、錄音與廣播：技術一再擴張著作權的疆界

進入十九世紀，1839年法國畫家達蓋爾發明世界上第一台真正的照相機，1861年物理學家麥克斯韋拍攝出第一張彩色相片，美國國會也在1865年修法將照片及底片納入著作權保護。1903年愛迪生控告競爭對手未經同意拷貝其遊艇下水畫面，促成1912年美國著作權法修正，將電影正式納入保護範圍。

公開利用的權利同樣是技術推著法律往前走。1847年三位法國音樂人因拒絕支付咖啡廳帳單，主張可用該場所表演其作品所獲的利益抵銷，1849年勝訴後，隔年在樂譜出版商協助下成立全世界第一個著作權集體管理團體SACEM。1887年留聲機問世，1911年英國著作權法修正，賦予錄音業者就其灌錄的唱片享有著作權；廣播電台在1906年出現、1920年代普及，電視廣播則在1925年問世、1930年代邁入商業應用。每一項新技術的出現，幾乎都意味著著作權保護範圍要再一次擴張。

(四) 影印機與網路：複製成本持續下降的年代

1949年全錄公司開發出靜電圖像影印機並大獲成功，「Xeroxing」一詞甚至成為「影印」的代稱。1970年代，廠商透過反托拉斯法迫使全錄公司釋出關鍵技術，日本廠商以低成本製造能力急起直追，全錄的市占率從1971年的93%滑落到1975年的60%，影印機售價隨之下滑，並開始普及於圖書館。1975年的Williams & Wilkins Co. v. United States案，促成美國著作權法在1976年新增第108條，處理圖書館合理使用的問題。

到了網路時代，1990年底Tim Berners-Lee提出全球資訊網，1991年網際網路開放民用，1993年美國副總統高爾提出國家資訊基礎建設計畫，各國紛紛跟進。1998年美國通過《數位千禧年著作權法案》（DMCA），其對網路平台責任的保障，事實上正是推動Web 2.0以使用者生成內容（UGC）為主流的關鍵制度基礎。

回顧這三百多年的軌跡，可以發現一個清楚的模式：著作權法總是「因應科技擴張權能範圍」「因應新的創作形式增加著作種類」「因應社會著作利用的需要調整著作財產權的限制」。也就是說，對作者創作的保護，某種程度上只是「羊頭」，背後真正支撐的，是一整套圍繞著著作而運作的商業機制，保護作者從來不是著作權法唯一、甚至未必是最主要的目的。而近代著作權法制真正面臨的挑戰，其實來自創作門檻的降低——當創作從專業擴散到業餘，著作權人不再是單一的群體，社會多元的需求都必須被兼顧，著作權法制很難再單純朝「擴張保護」這一個方向發展，每一次修法都顯得吃力不討好。生成式AI的出現，正好把這個既有的挑戰推到了極致。

二、生成式AI的特殊之處：同時衝撞「著作利用」與「創作門檻」

過去技術帶來的衝擊，大多集中在單一面向——攝影衝擊的是「什麼可以受保護」，影印機衝擊的是「複製的界線在哪裡」。生成式AI不一樣，它同時在兩個維度上衝撞既有的著作權制度。

第一個維度是「著作利用」：大型語言模型的訓練資料從哪裡來、是否合法？使用者在輸入提示詞時，把他人著作貼進去使用，算不算重製？應用生成式AI服務時，偶然生成與他人著作高度近似的結果，又該如何定性？第二個維度則是「創作門檻下降」：生成式AI讓各領域基礎技能的門檻大幅降低，沒有經驗的人也能跨領域產出看起來相當專業的作品。這就帶出一連串過去著作權法少見、卻必須正面回答的問題：生成式AI生成的成果，是否受著作權法保護？著作抄襲中「實質相似」的判斷標準，會不會因為生成式AI的技術特性而被迫調整？建立在商業機制之上的著作權制度，是否仍是著作流通利用的主流模式？專業製作的作品與應用生成式AI生成的作品，保護範圍是否應該有所區隔？

這些問題，沒有一個能用過去單一案例的思路直接套用回答，必須回到著作權法的基本原理，逐一拆解。

三、AI訓練資料的著作權爭議

(一) 預訓練不是資料庫，而是機率模型

要理解訓練資料的爭議，得先簡單理解大型語言模型怎麼「學習」。以一句話為例：「To be or not to be. That is a question.」模型會先把句子拆解成一個個詞（Tokenization），再把每個詞轉換成電腦能處理的數字（Embeddings）。這些數字接著被放進類似人類大腦神經網絡結構的類神經網絡中，網絡裡存有大量參數，參數之間關聯性的強弱，會隨著訓練資料的內容不斷被調整。當使用者輸入問題，模型就依據上下文，沿著關聯性較高的路徑，運算生成輸出的內容。換句話說，預訓練的過程，本質上是在學習詞與詞、概念與概念之間的「關聯性」，而不是把著作整篇收進一個可供檢索、複製的資料庫裡。這一點，會直接影響後面合理使用的判斷。

(二) 巨量資料從哪裡來？權利碎片化的兩難

問題在於，大型生成式AI需要極為龐大的資料進行預訓練，但著作權人散布在世界各地、權利極度碎片化，實務上根本不可能一一取得每個權利人就「用於AI訓練」的合法授權。目前各國對於AI訓練資料的法律定性也還沒有定論。日本著作權法第30條之4算是走得比較前面的立法例，明文規定著作物若非以「自己或他人享受該著作物中思想或感情表達」為目的而利用——包括供資訊分析（即從大量著作物或資訊中擷取語言、聲音、影像等要素進行比較、分類或解析）之用，或不涉及人之感知而用於電子計算機資訊處理過程的情形——在必要範圍內，得不限使用方式加以利用，但若可能對著作權人造成不當損害，則不在此限。

(三) 套入第65條合理使用四要素檢驗

回到我國著作權法，第65條第1項明定著作的合理使用不構成著作財產權侵害，第2項則列出四項應審酌的基準：利用的目的及性質、著作的性質、所利用的質量及其占整個著作的比例，以及利用結果對著作潛在市場與現在價值的影響。法院可以審酌其他情形，但這四項基準一定要納入考量；不過審酌結果未必是平均分配權重，個案中某幾項基準可能比其他基準更具決定性。

把這四項基準套用到「將他人著作用於LLM預訓練」的情境，可以得到一個相對立體的圖像。就利用目的與性質而言，預訓練的目的是學習著作內容彼此間的關聯性，而非把著作當作後續生成的素材直接使用，這個方向應該偏向正面評價。就著作性質而言，預訓練需要的是大量、多元的著作，但沒有非特定某著作不可，這種「沒有特定用途」的特性，過去案例中相對少見，較適合評為中性。就利用的質量與比例而言，AI訓練通常會用到接近完整的著作——即便經過部分處理，就著作權法的角度，仍可視為利用了著作的絕大部分，這一點偏向負面評價。最棘手的是市場影響：授權他人將自己的著作用於AI訓練，理論上確實存在潛在市場，但這個市場需要的是Big Data規模的授權，而不是傳統一對一的授權模式，在缺乏大量授權機制配套之前，這一項恐怕也只能評為中性。四項基準交叉之下，目前仍難以得出一個放諸四海皆準的結論，這也是各國立法與司法都還在摸索的原因。

(四) 國際治理趨勢：歐盟AI法第53條、DSM指令第3、4條

訓練資料來源是否合法，很可能會成為未來企業能否自行訓練AI模型的關鍵。歐盟《人工智慧法》第53條要求通用目的AI（GPAI）供應商——不論是OpenAI、Google DeepMind，或是Anthropic——在歐盟市場提供模型服務時，必須向主管機關公開「足夠詳細的訓練資料摘要」，說明主要原始資料來源類型、組成內容與代表性，讓著作權人或個資當事人能藉此辨識自身權益是否受影響，進而行使opt-out等權利，或追溯模型來源。這項透明度義務並未排除開源模型，只要在歐盟提供服務，就須公開訓練資料來源；若來源屬未合法取得的資料，著作權人便可能據此主張權利。

歐盟《數位單一市場著作權指令》則分別在第3條與第4條設有文本與資料探勘（TDM）的例外規定。第3條僅適用於以科學研究為目的、由研究機構或文化遺產機構進行的文本與資料探勘，前提是對「合法取得」的著作或標的物進行重製與擷取，所稱合法取得包括付費訂閱的期刊資料庫，或網路上可免費接觸的內容，但適用主體僅限非營利、公益性質的機構，範圍相對有限。第4條則是一般性的資料探勘例外，適用主體與目的都寬鬆許多，但同樣設有衡平機制——權利人可以用機器可讀取的方式，明示保留不提供作為資料探勘使用，這正是前述《人工智慧法》要求尊重著作權人opt-out規範的制度基礎。整體而言，歐盟的立法方向，是希望在促成AI發展與尊重著作權人之間，建立一套透明、可追溯、可選擇退出的機制。

四、應用生成式AI服務的四個常見著作權問題

把視角從訓練資料拉回到一般使用者應用生成式AI服務的日常情境，實務上經常碰到的問題，大致可以歸納為四類。

議題一：生成成果是否受著作權保護？ 這牽涉到著作權法「人類精神創作」的原則，關鍵在於成果是否體現了人類的創作意圖與選擇，而不是單純按下按鈕就自動產出。

議題二：輸入他人著作，是否構成侵權？ 把他人著作上傳到生成式AI服務本身，已經構成重製行為，是否能主張合理使用，仍須回到個案判斷，這正是第51條規範的範疇。

議題三：AI生成作品援引他人著作，可否主張合理使用？ 這裡要回到第65條的四款基準，以及第46條、第52條等特別規定逐一檢視，不能想當然認為AI生成的內容就自動取得合理使用的豁免。

議題四：偶然侵權的使用者是否須負責任？ 當使用者並不知道生成結果與他人著作近似，主觀上的故意或過失就會成為判斷重點。實務上，保留AI使用過程的紀錄——包括提示詞、生成版本、修改過程——會是使用者自我保護最務實的做法。整體而言，對生成式AI運作機制與自己所處專業領域的熟悉程度，會是規避這些風險最關鍵的能力。

關於議題三，第52條規定「為報導、評論、教學、研究或其他正當目的之必要，在合理範圍內，得引用已公開發表之著作」。傳統實務上，書籍與論文依學術倫理引註，原則上會被認定屬於合理引用，但攝影、美術著作的引用範圍，向來就比較難拿捏。生成式AI對於使用者輸入的著作，若未經事後加工，通常不會主動在生成成果中標註出處或作者，如果是以他人著作作為素材生成內容，使用者就必須特別留意標示的問題。倘若預訓練資料中本就含有他人著作，而使用者完全不知情，問題就會回到議題四所談的「偶然侵權」判斷框架。

五、創作門檻下降，動搖著作權保護的根本假設

(一) 從「直接創作」到「間接引導與篩選」

傳統的創作模式，是人類「直接創作」，判斷重點在於是否由人類完成、是否具有原創性，背後隱含的前提，是創作行為與創作成果之間存在可以辨識的對應關係。生成式AI模式下，人類的角色變成「間接引導與篩選」，判斷重心轉移到人類實質參與的程度，包括提示詞的設計、修正的過程、結構的安排。這帶來一個結構性的挑戰：從「結果判斷」轉向「過程判斷」，而過程的界線往往很難精確劃定。隨著創作稀缺性這個基礎假設逐漸動搖，「創作」與「生成」之間的界線也愈來愈模糊。

(二) 抄襲標準可能僅剩「實質相似」

過去判斷抄襲，重心放在「接觸事實」加上「實質相似」，著重的是行為過程與來源證據。進入AI時代，判斷重心逐漸轉向「實質相似」加「表達結構」，也就是從「行為證據」轉向「結果比對」。這個轉變帶來的副作用，是司法成本上升——比對技術的介入，某種程度取代了原本由人類專業判斷的空間；同時舉證難度也隨之增加，因為要證明AI模型的取樣來源，遠比證明人類創作者接觸過某件作品困難得多。著作權的界線，恐怕需要重新校準，立法與裁判標準也必須同步調整。

(三) 創作價值核心：從「製造」轉向「策展」與「賦義」

創作門檻降低之後，也促使我們重新思考嚴格保護著作的必要性是否一致適用於所有情境。當作品的「產出」本身愈來愈容易，創作價值的核心，逐漸從產出轉移到選擇、整合、詮釋這三項能力：從大量AI產出中判別優劣與適配的選擇能力；結合多元生成結果、建構連貫脈絡的整合能力；以及賦予作品意涵、回應特定情境的詮釋能力。換句話說，與AI相關的創作價值，正在從「製造」轉向「策展」與「賦義」。

(四) 吉卜力風潮給我們的提示

文章開頭提到的吉卜力風圖像熱潮，正好是這一切的縮影。生成式AI採用的大型語言模型，演算法基礎在於模仿人腦神經網絡運作的類神經網絡，透過大量資料訓練、校正與後訓練，在算力足夠的前提下，許多領域的表現已經超越人類一般水準。當使用者輸入照片，就能生成吉卜力畫風的圖像並洗版社群網站，這個現象之所以特別值得注意，是因為「繪畫風格」在傳統著作權法上，本來就屬於不受保護的抽象概念。但這不代表問題就此消失——隨著生成式AI的創作表現愈來愈強，抄襲的判斷標準很可能反而變得更嚴苛，因為當生成內容愈接近、甚至超越人類創作水準時，人類創作所能主張的保護空間，反而可能因此被進一步限縮。

六、結語：著作權制度一直走在動態平衡的路上

著作權法第1條開宗明義寫著：「為保障著作人著作權益，調和社會公共利益，促進國家文化發展，特制定本法。」著作財產權是人類依據社會發展需求，後天設計出來的制度，本來就帶著追求不同利益衡平的使命，而不是一套天然、絕對的權利。

我國著作權法的設計，可以想像成一條光譜：一端是著作財產權的保護，另一端是著作財產權的限制，中間的空間，主要透過授權機制來處理——授權又可以再區分為個別授權與集體管理授權，至於著作財產權的限制，另外還有法定授權（例如教科用書）這類特殊安排。事實上，除了這些既有制度，世界上還存在其他可能的選項，例如針對重製設備或空白媒體課徵的著作權補償金機制（Copyright Levy）、強制授權，或是集體管理團體的延伸集體授權（Extended Collective Licensing）。這些制度之間的選擇，本質上是價值的選擇，沒有絕對的好壞，需要社會逐步形成共識。

從降低交易成本的角度回頭檢視，著作財產權的限制規定，其實是在明定「什麼能做、什麼不能做」，不能做的部分，就交給授權機制處理；至於那些不屬於著作財產權限制範圍的利用行為，也應該從降低交易成本的角度，思考授權機制可以如何規劃。以AI訓練資料的集中管理平台為例，這類平台讓權利人自行訂價，透過科技降低授權成本，但無法處理尚未上架的資料，權利人也不可能在全世界所有平台都上架自己的著作，恐怕無法完全滿足AI訓練的全部需求。傳統的集體管理制度，則僅適用於具有一定商業市場規模的場景，如果市場不夠大，就不會有人願意成立或參與集體管理組織的運作。至於著作權補償金機制，又必須搭配著作財產權限制及補償金分配組織才能運作。換句話說，沒有一個制度是萬靈丹，每一種制度選擇背後，都有它適用的條件與限制。

生成式AI基礎模型的訓練，需要的是巨量且多元的資料，但面對的卻是權利高度碎片化的環境，從這個角度看，法制確實已經到了該調整的時候。那麼，我們究竟期待AI開發者做到什麼？適度減輕責任，或許反而能引導出更多正向的揭露與合作行為；在責任體系的檢討順序上，刑事責任應該優先於民事責任被仔細檢視。至於「科技會不會消滅創作」這個常見的疑慮，其實值得換個角度想：在著作權法出現之前，人類也從未停止創作；而即便我們選擇不主動使用某項科技，仍然會持續享受到科技發展帶來的好處。任何新科技，總是同時帶來正向與負向的影響，我們能做的，是盡量讓正向的影響發揮得多一些，負向的衝擊縮小一些—從過去三百多年的經驗來看，科技持續向前走到今天，帶給人類的，終究還是好處居多。

著作權制度從活字印刷術走到生成式AI，從來不是一條筆直的路，而是一段又一段在保護與限制之間反覆校準的過程。這次，輪到我們這一代，去找出下一段動態平衡。

賴文智律師 / 所長 Wenchi Lai