生成式人工智慧技術迅速發展,AI訓練仰賴大量資料來源,衍生對於著作權、版權的侵害問題也一一浮上檯面。稍早,美國AI新創Anthropic公司遭多家出版機構提告,指控其未經授權擷取500萬~700萬本書籍作為語言模型Claude的訓練資料,已明顯侵犯著作權,可能面臨天文數字的賠償。這起事件對AI產業發展敲響一記警鐘,「資料有價、創作內容有價、新聞報導有價,不能被任意、無償使用作為AI訓練素材」的觀念,應予以正視。
當AI產業正步入關鍵規模化階段,台灣也正加速追趕全球趨勢,推進AI產業發展,而行業發展如何兼顧創新與法治、發展與秩序,都得仰賴政府儘快制定《人工智慧基本法》,給予產業明確指引。
「內容有價」的觀念,早已成為新聞媒體業與社群平台、科技業者間的抗爭焦點,社群平台業者無償掠取新聞媒體的報導吸引流量,獲得大把數位廣告收益,新聞媒體投入大量人力、時間與資源採訪報導,卻無法享有合理報酬與控制權,形成扭曲、不合理的現況。
一樣的狀況,也發生在AI訓練上。AI語言模型為展現生成能力,得仰賴大量資料的訓練,網路上隨處可掬的新聞報導、書籍內容資料,就成為最佳素材來源。然而,這些內容多數具明確著作權標的,業者打著科技創新之名,未經授權就逕自擷取作為AI語言模型訓練使用,超出「合理使用」範圍,明顯侵害版權、著作權。
以此次Anthropic事件為例,根據國外媒體報導,其模型可在用戶輸入提示後,產出與書籍原文高度相似的內容,顯示訓練資料來自未經授權的資料庫,違反美國著作權法相關規範。該案一旦成立,除Anthropic將面臨鉅額求償外,更將重擊全球AI產業,也勢必推動各國重新檢視其AI資料治理政策。
歐盟近期在《人工智慧法案》中,特別規定AI公司須揭露訓練資料來源,並保障媒體內容的使用權限;美國亦有出版業者與AI企業協商授權與分潤機制,朝向市場機制與法規並行的路徑前進。台灣卻因沒有相關法規,導致本土媒體無法主張權益,進一步造成產業競爭力弱化的苦果。
鑑此,政府應該儘速完成《人工智慧基本法》草擬與公告,並納入以下二大方向:一、建立資料使用原則,須明確定義AI訓練資料的可用範圍、授權機制與揭露義務,保障資料提供者的「知情權」與「控制權」,並設立申訴與補償制度,減少未來訴訟風險。
二、強化智慧財產、著作權、版權等保護機制,特別是保護新聞報導、原創性著作、影音內容,防止AI模型直接重製或再利用內容而不給報酬。
不可否認,AI產業已成為先進國家科技競爭的重心,台灣在半導體、數位應用、資通訊等方面具優勢,若能同步完善法制基礎,將更有助在全球AI競賽中取得一席之地。反之,若對資料使用與法律責任缺乏清楚規範,勢將讓AI創新蒙上法律陰影,甚至引發國際訴訟與信任危機,得不償失。
AI創新不該以犧牲原創者權益為代價,唯有建立清楚且公平的法規制度,保障資料擁有者與使用者雙方的權益,AI發展方能走得穩、走得遠。
*本文經工商時報授權轉載,原文連結:https://www.chinatimes.com/newspapers/20250806000105-260210?chdtv
Comments are closed.