首頁 > 知識分享 > 創用CC授權資源投入AI訓練的法律議題-以國家文化記憶庫資源為例(2)

創用CC授權資源投入AI訓練的法律議題-以國家文化記憶庫資源為例(2)

2023/09/22
目錄

三、各項創用CC要素投入AI訓練之問題

創用CC授權模組共包含四種授權要素,分別是姓名標示(BY)、非商業性(NC)、禁止改作(ND)以及以相同方式分享(SA),再由前述四個授權要素,組成六種常用的授權方式,包括「姓名標示」(CC BY)、「姓名標示─非商業性」(CC BY-NC)、「姓名標示─非商業性─相同方式分享」(CC BY-NC-SA)、「姓名標示─禁止改作」(CC BY-ND)、「姓名標示─非商業性─禁止改作」(CC BY-NC-ND)、「姓名標示─相同方式分享」(CC BY-SA)。【註9】以下即以各項授權要素探討創用CC之資源是否適合作為AI訓練資料。

(一)姓名標示(BY)授權要素之資源

包含BY授權要素之資源,使用者必須按照著作人或是授權人指定之方式表彰其姓名,以及如使用者有對該著作進行改作時應為相關說明。在授權為CC BY之情形,使用者能夠為任何利用,包括商業使用,只要使用者有以著作人或是授權人指定的方式表彰其姓名。【同前註】而在六種常見的授權方式中,皆包含此授權要素,因此倘此授權要素用於訓練AI時無法被滿足,基本上所有創用CC資源均無法使用。

在散布或公開演播(於創用CC授權條款之定義,指以任何公開利用之方式)利用BY授權要素所產生之作品時,應依照授權條件進行姓名標示【註10】。將BY授權要素之資源投入AI訓練時,原則上姓名標示義務尚未產生,該義務將於AI訓練完成經公開利用產生。如未標示則屬違約之行為,以該資源訓練AI即屬未經授權之行為。是以,若從BY授權要素檢視將創用CC資源投入AI訓練後之利用議題,應該視不同AI的應用進行評估。

舉例而言,若屬於識別型的AI應用服務,像是識別圖像或錄影畫面中的貓、狗、物品、地形、地貌等,AI在經過訓練後,具有識別各類圖像所傳達各種資訊能力,因為對外提供服務時不需要重複使用訓練資料,也不會在服務提供時包含原始訓練資料,即無須遵守創用CC有關姓名標示之要求;但若屬於生成式AI,雖然生成式AI訓練的目的是期待AI產出與原始訓練資料不同的成果,但仍然無法排除會生成出與原始訓練資料近似的成果,此即會涉及將創用CC的著作對外公開利用,而生成式AI可能亦無法自行識別是否利用特定創用CC著作,要達成其標示姓名之要件並不容易。

目前歐盟現正規劃之《AI Act》,對於生成式AI之要求即是公開受著作權保護著作用於訓練AI之摘要資訊【註11】,某種程度上即屬於表彰該等訓練資料貢獻的方法。惟若依照現行BY授權要素之標示要求,須對每一著作之使用逐一標示,以摘要之方法仍然顯然未達要求,恐須Creative Commons組織未來修訂新版本的授權條款時,針對此等特殊利用需求增訂明確的條款處理。

(二)非商業性(NC)授權要素之資源

NC授權要素為非商業性,指不得主要為用於或針對商業利益或財務上的報酬而使用含該授權要素之著作【註12】,例如,為了商業委託案而使用NC授權著作。針對AI訓練的議題如前述說明,若僅單純訓練而未對外提供商品或服務,實際上無法判斷其究竟是否為前述商業使用,故內部訓練本身並不會有違反創用CC授權條款的問題。而對外利用時,除前述有關姓名標示議題外,若屬於可能會在提供AI應用服務時產出或利用到原始訓練資料,利用含NC授權要素之著作進行AI訓練,即應限於後續服務屬於研究或其他非商業利益之目的。若所訓練之AI可能會使用原始訓練資料作為服務的一部分或可能產出與訓練資料相似的成果,像是ChatGPT、Midjourney此等商業用途的生成式AI服務,利用含NC授權要素之資源進行訓練,對外提供服務時即與直接抓取網路上其他著作類似,都會面臨著作權侵害的風險。

(三)禁止改作(ND)授權要素之資源

ND授權要素為禁止改作,亦即只能完整使用著作,不能使用部分或更改著作內容而對外散布或公開利用。【同註9】在訓練AI時,若是將ND授權之著作完整重製作為訓練資料,並未違反ND授權要素之規範。惟如作為ChatGPT、Midjourney等生成式AI對外提供服務,因其訓練時所儲存之各種資訊、文字與圖形間之關聯性、前後文之關聯性等,可能因為使用者的Prompts、演算法、機率等,產出內容有可能與原始訓練素材相似的成果,而生成式AI必然會與原始訓練資料不同,如屬創用CC禁止改作的授權,即立刻會面臨違反ND授權的風險。

另一種可能不會違反ND授權要素的情形,可能要AI的業者自行設計規避。著作權法第10條之1規定,「依本法取得之著作權,其保護僅及於該著作之表達,而不及於其所表達之思想、程序、製程、系統、操作方法、概念、原理、發現。」如能夠確保該AI對外提供服務時,僅使用到訓練資料中抽象的「思想、程序、製程、系統、操作方法、概念、原理、發現」,而不使用到具體的「表達」,例如AI僅學習某些著作的風格、畫風,抽取其中「抽象」的部分,且限於產出與原始著作主題不同的作品,則因為其使用到的部分是屬於著作權法不保護的抽象思想、原理、原則,即非創用CC授權條款所稱之改作,不會構成創用CC禁止改作條款的違反。

(四)以相同方式分享(SA)授權要素之資源

SA授權要素包含兩個大原則,一是使用含SA授權要素之資源所完成的著作亦必須使用相同或相容的方式再為授權,二是在SA授權要素下,不能再添加其他限制條款,舉例而言原本沒有NC授權要素之著作,即不得再新著作添加NC授權要素。在使用SA授權要素之資源下,也要將自己的新著作授權出去,讓大眾可以利用,從自由分享的角度而言是優點,惟也有人批評SA授權要素為「感染式授權條款」。【註13】

將SA授權要素之資源用於AI訓練,是否表示整個訓練AI的資料庫都要以相同方式再為授權?依照Creative Commons組織之說明,SA授權要素只有在著作被修改且公開分享時才會適用。因此需要適用SA授權要素的仍然是該著作被修改且又被公開時,才需要以相同方式分享,如果僅是存在於資料庫中,並不會使整個資料庫變成須以相同方式分享。【註14】

AI訓練後所為之產出若有利用SA授權要素之資源且被公開分享,在利用時可能會經利用、修改,原則上在利用時會有以相同或相容方式再授權之義務。惟此義務在生成式AI的服務事實上難以遵守,因實際上生成式AI的服務提供者,無法知悉哪些產出須以相同方式分享,而使用者根本無法知道該等生成式AI產出的成果是利用哪一個創用CC相同方式分享授權的作品。例外情形與前述ND之情形類似,除產出之內容僅利用畫風、風格等不受著作權保護之部分,有機會不受該SA授權條款所限制。

(五)小結

檢視以上創用CC授權要素,將該些著作用於訓練AI之問題大抵不在投入之重製行為本身,而是在後續AI經發布、使用時,不容易符合創用CC授權要素之條件。雖Creative Commons組織認為CC授權模組在一開始設計時即有考量到未來之應用,惟逐一審視該些授權要素,針對後續AI的應用,可能識別型的AI服務,因為所產出的是分析資訊,與原始的訓練資料無涉,通常沒有特別的問題,任何一種創用CC授權著作都可以允許作為AI訓練使用;但若為目前最熱門的生成式AI,因為雖然是生成新的成果,但服務提供者及使用者均無法將該等成果與特定訓練資料連結,亦無法有效標示或遵守像是禁止改作、非商業利用或相同方式分享的授權要求,確實有其窒礙難行之處。若Creative Commons組織有意讓創用CC授權之資源作為訓練AI之素材,並可作為生成式AI的應用服務,會需要進行創用CC授權條款的特殊安排,不然,創用CC授權的著作就只能與其他一般著作相同,最終還是要回歸著作權法中關於合理使用的個案認定。


創用CC授權資源投入AI訓練的法律議題-以國家文化記憶庫資源為例(1)(2)(3)  

註9:創用CC授權條款,https://zh.wikipedia.org/zh-tw/知识共享许可协议#署名

註10:姓名標示 3.0 臺灣,https://creativecommons.org/licenses/by/3.0/tw/legalcode

註11:EU AI Act: first regulation on artificial intelligence,https://www.europarl.europa.eu/news/en/headlines/society/20230601STO93804/eu-ai-act-first-regulation-on-artificial-intelligence

註12:NonCommercial interpretation,https://wiki.creativecommons.org/wiki/NonCommercial_interpretation

註13:相同方式分享,https://zh.wikipedia.org/zh-tw/相同方式共享

註14:Frequently Asked Questions:If CC SA-licensed content is included in a database, does the entire database have to be licensed under an SA license?,https://creativecommons.org/faq/#what-are-the-limits-on-how-cc-licensed-works-can-be-used-in-the-development-of-new-technologies-such-as-training-of-artificial-intelligence-software。 

請輸入關鍵字