首頁 > 知識分享 > 創用CC授權資源投入AI訓練的法律議題-以國家文化記憶庫資源為例(3)

創用CC授權資源投入AI訓練的法律議題-以國家文化記憶庫資源為例(3)

2023/09/22
目錄

四、 創用CC授權資源可能涉及之其他法律問題

創用CC授權係為讓權利人得以方便、簡單將其著作釋出讓大眾利用之授權模組,僅處理著作權之問題,若個別著作另涉及其他權利,例如肖像權、隱私權、個人資料、原住民族傳統智慧創作等,應再個別另行處理。舉例而言,若創用CC授權資源包含他人肖像,則原則上應取得他人同意才能用於AI訓練之中;創用CC授權資源倘包含個人資料,則所使用之資料必須符合個人資料保護所定關於蒐集、處理及利用之規範,須注意取得資料的來源以及利用是否符合蒐集之目的。

2019年即有IBM利用Flickr網站上標示CC授權的照片訓練人臉辨識AI所產生的爭議。【註15】亦即,IBM雖然使用的是CC授權資源,並僅作為識別型AI服務,並沒有違反CC授權條款的問題,惟其所使用的照片包含大量肖像即有涉及個人資料保護法違反之議題。由於創用CC授權條款僅處理著作授權事宜,有意利用創用CC授權作品進行AI訓練的業者,必須理解著作以外的法律議題,並非創用CC機制所能解決,並不是採取此類開放授權,就是放棄其他各種法律上保護的權利。

五、記憶庫資源應用於AI之方式

國家文化記憶庫(以下簡稱「記憶庫」)資源多採創用CC授權,讓其資源可以在符合創用CC授權規範下直接利用,無須逐一取得著作財產權人的授權。記憶庫之大量圖像、文字及標記的資源,是否適於訓練AI呢?承上所述,大部分之創用CC授權要素在投入訓練時基本上不會被觸發,針對AI訓練階段基本上是沒有問題的,但訓練完成後則視AI服務的類型而定。

目前記憶庫資源較具AI訓練價值或應用者,大致上可以分為下述幾類:

(一)圖像與文字資訊的連結

記憶庫資源在徵集時,提供單位必須填寫該等圖像資料相關的文字資訊,即相當於以人工識別並標記的高品質資源,若是屬於識別類的AI,例如:只要掃瞄特定圖像,即可辨識該等圖像拍攝的時空背景,或是用於生成與該特定圖像受保護部分無涉的成果,例如:AI學習大量1980年代的照片,為遊戲軟體生成該時代背景的過場動畫等,因為攝影著作保護的是構圖、光影變化等「具體表達」,而AI學習的是照片中的建築物外觀或場景,不會直接使用該照片的構圖、光影變化等,即不會構成對攝影著作的侵權。在記憶庫主要採取創用CC授權的情形,相較於在網際網路上其他授權不明的著作,記憶庫顯然是此類AI應用訓練安全且具權威標記的高品質訓練資料的來源。

1980年代斗南順安街,雲林縣政府新聞處,國家文化記憶庫,創用CC姓名標示 3.0 臺灣及其後版本(CC BY 3.0 TW +)。

1980年代初期褒忠老街,雲林縣政府新聞處,國家文化記憶庫,創用CC姓名標示 3.0 臺灣及其後版本(CC BY 3.0 TW +)。

(二)特定主題或風格的訓練資料

承前所述,著作權法第10條之1僅保護著作具體的表達,並不保護抽象的思想、概念、原理、原則、發現等。以記憶庫目前整體的一些主題資源,例如:礦工、原住民族的照片等,作為圖像型態的AI訓練,再用以生成不是照片形式的美術著作,並不會構成對於該等照片攝影著作的侵害;而特定年代的照片或美術作品,也可以讓AI學習並產出具有該等年代風格特色的照片或美術作品,只要在生成的演算法刻意排除與訓練資料相同主題即可大幅降低風險。

東慶煤礦的礦工,余重慶,國家文化記憶庫,創用CC姓名標示 3.0 臺灣及其後版本(CC BY 3.0 TW +)。

瑞三鑛業保安新村與敬業新村-2,周朝南,國家文化記憶庫,創用CC姓名標示 3.0 臺灣及其後版本(CC BY 3.0 TW +)。

(三)記憶庫資源作為使用者輸入AI服務應用的來源

創用CC作品作為AI通用性的訓練是一種利用,但面對AI時代另一種是使用者使用他人訓練好的AI服務。例如:使用者可以選擇記憶庫中創用CC BY-NC的圖像,輸入相關生成式AI的圖像來源,生成出屬於自己獨特的圖像,再依創用CC相關授權規範標示及利用,亦是記憶庫資源應用的方式之一。

(四)區別不同授權條件作為訓練資源

記憶庫資源有明確的創用CC不同授權模式的標示,AI服務相關業者可以依其未來對外提供服務的規劃,選擇適合的創用CC授權資源進行訓練,以降低未來提供服務的風險。例如:避免禁止改作、相同方式分享的授權著作,若屬商業服務,則也可提前預防避免使用非商業性的創用CC資源。

六、結語

以創用CC各項授權條件逐一檢視下,目前的創用CC條款針對單純的AI訓練,在未對外提供服務時,應屬合法;但若需要對外服務,則須依各種不同的AI服務逐一判斷,但以目前最熱門的生成式AI,因為無法確切掌握生成的成果與訓練資料間的關聯,似難以遵守相關姓名標示或其他授權條件,若直接使用於生成式AI訓練,除非可以確保生成的成果僅會利用抽象的思想、概念、原理、發現等,否則,只要涉及具體的表達全部或部分的使用,即使僅是因為關連性、使用者操作、機率等服務提供者難以控管的原因,因為確實有使用該等訓練資料,仍然會有侵權的疑慮。若要讓採用創用CC授權之資源能夠完全安全、合法作為AI服務使用,應再調整創用CC授權之條款。

臺灣著作權法目前並未參考部分國家訂有特別的資料探勘或資料分析的著作財產權限制條款,對於一般著作而言,單純作為AI訓練資料因為通常涉及著作的重製,必須要透過著作權法第65條第2項有關合理使用的規定個案處理。相對之下,採取創用CC授權的著作,在單純訓練階段,反而是相對合法(取得授權)又安全,值得作為臺灣有意踏入AI領域業者優先採用作為AI訓練資料來源;此外,作為客製化屬於臺灣特色版本的AI,也是已經經過適當標記的高品質資料。

此外,對於AI時代的使用者而言,其等亦可利用記憶庫大量的創用CC授權資源,選擇適當的授權條款,例如:若為商業使用,即不要選擇非商業性,若有改作需求,則不要選擇禁止改作,可以讓AI依使用者的指示進行創作,善用生成式AI降低創作門檻的特性,讓不會繪圖的使用者,可以輕易表達出心中所構思的創作,再由AI的使用者於利用時依照創用CC授權之條件進行標示即可。AI時代來臨,記憶庫在徵集階段即採取創用CC授權機制,未來在推廣記憶庫資源的應用時,無論是作為AI訓練之資源,或使用者尋找適當的表達素材,都是可以注意的方向。


創用CC授權資源投入AI訓練的法律議題-以國家文化記憶庫資源為例(1)(2)(3)  

請輸入關鍵字