——以美國湯森路透訴羅斯公司案為例
作者 | 王興 北京市乾坤律師事務所
【內容摘要】羅斯公司使用湯森路透公司2234份Westlaw判例摘要訓練自創的法律服務AI,法官在2023年判決中,傾向于認可羅斯公司引用“中間復制”相關判例來證明自己也是合理使用。但在2025年判決中,法官進行了修正,認為羅斯公司不滿足美國版權法規定合理使用的四要素,構成版權侵權。
【關鍵詞】AI訓練、判例摘要、版權、中間復制、合理使用
當下,法律、科技和文藝界對未經許可利用受版權保護作品訓練AI是否侵權,是否為合理使用等問題都極為關注,存在廣泛爭議。2025年2月11日,美國第三巡回上訴法院斯蒂芬諾斯·?巴斯(Stephanos Bibas) 法官針對湯森路透公司和西部出版公司(Thomson Reuters Enterprise Centre GMBH and West Publishing CORP.,以下簡稱TR公司和WEST公司)訴羅斯信息公司(Ross Intelligence INC.,以下簡稱ROSS公司)案作出簡易判決,認定ROSS公司利用TR公司Westlaw系統的判例摘要訓練其AI系統構成版權侵權,不是合理使用。此判決為類似爭議的解決提供了參考,本文進行分析。
一、案情背景簡介
TR公司是全球知名的信息服務供應商,提供法律、稅務、科技、風險管理等商務和專業智能信息服務,主營地位于瑞士楚格。(注1)WEST公司主營地位于美國明尼蘇達州伊根市,所運營的綜合性在線法律信息平臺Westlaw包含大量判例、州和聯邦法律法規、法律期刊論文,以及WEST團隊編輯組織策劃的專有法律材料等,是美歐律師和法官們的重要工具。(注2)Westlaw內容版權歸TR公司所有。
ROSS公司是一家開發法律領域AI的初創公司,由畢業于加拿大薩斯喀溫徹大學法學院的多倫多律師安德魯·阿魯達(Andrew Arruda),畢業于多倫多大學的計算機專家吉莫·歐比亞杰爾(Jimoh Ovbiagele)和帕爾格爾斯·達洛吉奧(Pargles Dall'Oglio),三人在2014年共同成立。ROSS公司開發的AI程序(以下簡稱ROSS或ROSS系統)可以讓律師用自然語言,而不是布爾術語(Boolean terms)或關鍵詞向ROSS系統詢問法律問題,檢索相關法律、案例摘要和案件處理方法,ROSS通過閱讀法律、判例和證據,進行推理并輸出答案。該AI程序能簡化法律研究,節省律師時間和客戶金錢。大成律師事務所(Dentons)的協作創新平臺Nextlaw Labs最早投資ROSS公司;ROSS公司在2015年獲得430萬美元種子輪融資后,又在2017年獲得了870萬美元A輪融資。(注3)訴訟時,ROSS公司是根據美國特拉華州法律組建并存在的公司,受本案影響,ROSS系統于2021年1月25日關閉。(注4)
ROSS公司為創建法律服務AI,需要獲取大量法律、判例和法律內容描述等法律材料,以及組織法律內容的方法進行訓練。TR公司拒絕ROSS公司獲得Westlaw使用許可后,2017年,ROSS公司與法律服務公司LegalEase合作構建數據集以訓練其AI,而LegalEase與TR公司有長期合同關系并有訪問Westlaw授權。原告指出:2017年7月之前,LegalEase平均每月約有6000筆Westlaw交易;2017年7月之后,LegalEase的Westlaw使用量激增,最后高達到每月約236000筆交易,增加近40倍,比美國排名前100律師事務所的平均月使用量高出近五倍;調查顯示LegalEase某些賬戶使用機器人軟件程序批量下載存儲Westlaw內容。LegalEase解釋正與一家機器學習法律研究公司(后來發現是ROSS公司)合作,為其提供大量數據以幫助創建新的法律研究產品。2018年1月,WEST公司起訴LegalEase并向ROSS公司送達傳票,還申請法院強制ROSS公司出示與LegalEase的合同和使用LegalEase提供的數據情況。2020年5月4日,WEST公司與LegalEase在明尼蘇達州法院達成同意判決和約定永久禁令;LegalEase同意禁止其復制Westlaw內容、使用機器人訪問內容和共享其Westlaw許可的禁令。兩天之后,TR公司和WEST公司起訴ROSS公司。
二、訴訟主要進程
2020年5月6日,兩原告在特拉華州法院對ROSS公司提起版權侵權和侵權性干擾合同兩項訴訟。(注5)訴狀稱:WEST公司創建Westlaw內容,其中包括獨特的West關鍵編碼系統(West Key Number System,以下簡稱WKNS)和West判例摘要(West Headnotes,訴狀中將此二者統稱為Westlaw內容);版權所有人TR公司拒絕ROSS公司訪問并使用Westlaw內容研究競品后,ROSS公司“明知和故意誘使”(intentionally and knowingly induced)LegalEase違反其與WEST公司的合同,非法復制原告受版權保護內容并將分發給ROSS公司。ROSS公司復制原告內容并基于此創建衍生作品構成直接版權侵權,WEST公司和LegalEase之間存在近十年的有效合同關系,ROSS公司誘使LegalEase違反合同復制下載Westlaw內容構成侵權性干擾合同;訴請尋求禁令救濟和損害賠償。
2020年7月13日,ROSS公司以原告沒有復制版權材料證據和侵權性干擾合同已過訴訟時效為由,向法院提交駁回TR公司的動議(motion)。8月10日,TR公司對該駁回動議提交答辯狀。
2020年12月14日和2021年1月25日,ROSS公司向法院提交答辯反訴狀和修改的答辯反訴狀。ROSS公司反訴稱:83%的美國律師事務所有Westlaw許可賬號,全美營收前100的律師事務所中此比例高達95%,TR公司在法律研究市場形成壟斷;TR公司通過限制性許可、排他禁令、虛假訴訟索賠等方式維護壟斷控制,其不公平競爭行為違反了謝爾曼反壟斷法(the Sherman Act)第2節和第1節規定;此外,Westlaw平臺存在捆綁公法數據庫和法律檢索工具(反訴狀統稱為法律檢索工具)的搭售行為。
2021年3月25日,TR公司針對ROSS公司反訴提交答辯狀。3月30日,特拉華州聯邦地區法官倫納德·斯塔克(Leonard P. Stark)認為TR公司的版權侵權訴訟符合:索賠主體的原始作品、是作品版權所有權人、在版權局注冊、ROSS公司被控侵犯版權行為四要素。法官對ROSS公司要求駁回TR公司版權侵權的動議,作出簡易判決(memorandum opinion)予以駁回。
2022年4月25日,斯塔克法官對ROSS公司反訴壟斷作出簡易判決:沒有證據表明TR公司通過虛假訴訟索賠以維持壟斷,ROSS公司基于謝爾曼法第2節的反訴不成立;但ROSS公司根據謝爾曼法第1節反訴TR公司搭售壟斷繼續審理。
斯塔克在2022年被任命為聯邦巡回上訴法院法官,本案由?巴斯法官審理。2023年9月25日,?巴斯法官在簡易判決(注6)(以下簡稱2023判決)中認定ROSS公司事實上至少復制了Westlaw部分判例摘要;但ROSS公司是否侵犯版權,是否存在實質性相似,是否為合理使用等爭議焦點,需由陪審團裁決。雙方在訴狀及答辯中也都同意“本案可由陪審團裁決的問題,則請陪審團裁決”。
訴訟期間,雙方動用了多名法律和AI專家證人提供證詞/專家意見。2024年8月2日,?巴斯法官對雙方專家證人的意見作出簡易判決:TR公司專家喬納森·克雷因(Jonathan Krein)介紹選取對比數據(ROSS公司數據集與Westlaw判例摘要)的方法,以及實質性相似分析方法,盡管其結論認為“可能不是完全復制的”,但法院只要求專家的方法可靠性,而不是使用“最好的方法或無懈可擊的研究”,且克雷因的方法沒有不可靠的明顯瑕疵或讓陪審團感到困惑;TR公司專家詹姆斯·馬拉科夫斯基(James Malackowski)關于版權侵權損害賠償(實際損害賠償+侵權者利潤/法定損害賠償)的法律意見有幫助;ROSS公司專家芭芭拉·弗雷德里克森-克洛斯(Barbara Frederiksen-Cross)引入新觀點的法律報告在之前就已完成且不會損害TR公司;(注7)TR公司專家艾倫·考克斯(Alan Cox)關于侵權方收益(總收入及扣減成本、費用)和被侵權方利潤損失計算,沒有充分界定、解釋或說明數據集之間的差異,其意見不可靠。法官采信克雷因、馬拉科夫斯基和弗雷德里克森等專家的意見,同意排除考克斯的意見。
2024年9月27日,?巴斯法官作出不支持ROSS公司反訴TR公司搭售壟斷的簡易判決。法官認為:非法搭售必須是兩個獨立的產品且需定義各產品的相關市場;ROSS公司以TR公司線上銷售公法數據庫曾經以印刷書籍形式出售,類比二者是獨立產品的證明錯誤;若按此,在線搜索工具也好比是印刷書籍搜索工具——目錄、索引和頁碼;此外,如同馬車演進為汽車,現今以汽車為主要交通工具(馬車雖存在,僅為娛樂),印刷書籍形式的公法市場存在,并不意味著在消費者易于理解使用的網絡搜索工具世界里,仍然存在單獨的公法市場,極少有用戶將兩者分開。
2025年2月11日,?巴斯法官作出簡易判決(注8)(以下簡稱2025判決),認定ROSS公司侵犯了Westlaw判例摘要版權,駁回了ROSS公司合理使用的抗辯。
三、本案判決版權侵權分析
本文主要討論ROSS公司使用版權作品訓練AI所涉侵權和合理使用問題,對原告“侵權性干擾合同”訴請和ROSS公司反訴不做分析。
(一)原告的訴請和主張
長久以來,WEST公司聘請律師編輯總結法律關鍵點,撰寫和原創性的判例摘要。同時,通過WKNS獨有的層次結構順序和分類編碼方法,把法律問題、判例摘要及判例、法律規定組織鏈接起來,在Westlaw平臺輸入檢索法律問題的關鍵詞,相關法律主題、判例信息等以結構化形式呈顯。起訴狀附圖并舉例:“遺棄和丟失的財產”主題中關鍵編碼是“性質和要素”“供陪審團參考的證據和問題”及“實施和效力”;而“性質和要素”主題關鍵編碼又包括“概述”“意圖”及“作為與不作為”等法律問題和原則相關子主題;其中“概述”關鍵編碼為1k1.1,當前共收錄了603個相關判例,每個判例又有一個關鍵編碼。點擊關鍵編碼可顯示相同判例列表,點擊判例摘要可顯示在判例文書中對應段落。WKNS可使案例、主題、法律問題等無限組合排列,給用戶提供精準法律導航,讓法律研究變得高效輕松,是Westlaw搜索工具的支柱。Westlaw平臺每天增加無數新判例,編輯律師定期審查判例摘要和 WKNS以確保準確性,原告為此投入大量人力、時間、金錢,TR公司每三個月向美國版權局注冊一次數據庫。因此,Westlaw內容具有原創性和創造性,是受版權保護作品。
LegalEasel因只提供法律研究和寫作支持服務,與Westlaw不形成競爭,從2008年起就獲得Westlaw訪問許可。雙方服務協議明確禁止LegalEase在WEST產品或網絡上運行或安裝任何計算機軟件,禁止向第三方批量銷售、再許可、分發、顯示、存儲或傳輸Westlaw信息。ROSS公司訓練其創建的法律服務AI需要獲取大量法律內容、內容描述和組織法律內容的方法,在沒有訪問權限情況下,明知和故意誘使LegalEase下載儲存Westlaw內容。根據美國版權法(1976)/美國法典第17卷第101條規定,ROSS公司未經授權復制和使用Westlaw內容創建競品系故意、惡意,且全然無視原告權利,應承擔版權侵權直接責任(Direct liability)、幫助責任(Contributory liability)和替代責任(Vicarious liability);對誘使LegalEase侵權承擔替代責任;損失賠償包括律師費、ROSS公司因侵權而獲得的任何收益、利潤、優勢及法定賠償,其中ROSS公司侵權所獲收益包括但不限于顯著降低開發成本。
(二)ROSS公司的抗辯
ROSS公司開發的是基于AI且更先進強大的自然語言搜索引擎,在判例文書等法律材料的實際文本中尋找自然語言訓練AI,而不依賴于體現法律文本的概念列表(如判例摘要)。根據美國法典第17卷第102(b)條規定,版權作品必須是原創性且富有創意的作品,原創性要求作品源自作者而不是從過去來源復制,創意則要求作品具有超越平庸或瑣碎的“火花”;判例摘要兩者都不具備。它只是對不受版權保護的判例文書和法律法規中有關主題、規則、概念的直接復制引用、背誦或注釋;即便證明判例摘要與判例文書文本間有細微差異,這種“明顯和典型”的選擇也不應得到版權保護,否則使WEST對判例文書的商業出版產生壟斷。
WNKS按字母順序排列法律主題和子主題(子主題包括基本法律文本定義、法律分析和推理中通常概念等),根據主(子)題出現順序依次分配關鍵編碼完全是基于功能考慮。由功能考慮決定如何以普通法法律制度規定方式,使用傳統的法律分析、推理模式和屬于公共領域的判例,這種法律分析內在體系和常見方法是法學院一年級學生就要學到的,也是律師面對新案件和法律問題所必須做的。WNKS結構反映了基本法律本身如何組織、法律的構成要素和思想,之所以有效是法律讀者、研究人員都可期望和能預見。WNKS整體安排和結構沒有原創性或創造性。
原告未證明有版權和復制的事實,未證明復制了作品中受保護的原創元素,僅聲稱可推斷發生了復制事實和兩作品有共同的目的或功能是不夠的;原告注冊版權似乎涵蓋了整個Westlaw數據庫,包括判例、教學大綱、判例法段落,而這些不是版權法保護范圍。根據合理使用原則四要素,原告沒有證明本案可排除合理使用原則;ROSS公司或LegalEase的行為屬于合理使用,不構成直接或間接侵權。
(三)法官認定的事實
比巴斯法官在2023和2025判決中認定:ROSS公司為了研發法律領域AI,申請Westlaw許可被拒后求助于LegalEase;ROSS公司委托LegalEase創建包括大約25000個問答的批量備忘錄(Bulk Memo),每個備忘錄有一個律師會問到的法律問題和4~6個答案,答案直接引自判例文書并有相關性評分。LegalEase開始手動創建、后通過文本抓取機器人創建備忘錄,ROSS公司將備忘錄轉換為可用于AI訓練的數據,該過程首先將書面語言編碼為數值化數據,然后通過特征生成器(Featurizer)對文本執行多種數學……運算。這套程序核心源于批量備忘錄。ROSS公司承認判例摘要影響了備忘錄的“問題”,但表示是律師最終起草而非復制這些問題。TR公司則稱25000個備忘錄都是復制(備忘錄的“問題”基本上是在判例摘要末尾加上問號),TR公司只對兩個子集的判例摘要(分別包含5367份和2830份)申請簡易判決,侵權索賠僅限于2830份備忘錄。專家弗雷德里克森報告中包括3384份判例摘要(含TR主張且陪審團認定版權有效的2830份判例摘要,以及TR公司未列入侵權但ROSS公司專家認定且ROSS公司作出回應的判例摘要)。比巴斯法官仔細對比3384份判例摘要后,認定ROSS公司實際復制2243份。此外,LegalEase向ROSS公司發送了一份來自WKNS的91個法律主題清單,和500份包括Westlaw判例摘要、關鍵編碼及注釋的判例;ROSS公司承認在創建實驗項目(項目最終放棄)的38個主題時考慮了該清單,而判例則沒有什么作用。
(四)法官兩次判決對比
比巴斯法官認為版權侵權索賠有三要素:(1)有效版權的所有權;(2)實際復制;(3)實質性相似。法官在2023判決認為第2個實際復制要素存在,而第1、3個要素需由陪審團裁決;在2025判決中則認定Westlaw判例摘要、關鍵編碼有原創性而版權有效,備忘錄“問題”與2243份判例摘要實質性相似。
比巴斯法官認為,根據美國法典第17卷第107條判斷合理使用的四因素:(1)使用的目的和性質;(2)受版權保護作品的性質;(3)與受版權保護作品整體相關的使用數量和實質性相似;(4)對受版權保護作品潛在市場影響。其中第1個和第4個因素最重要的,2023判決將四因素都交陪審團裁決;在2025判決則判定TR公司在第1、4兩因素獲得支持,并在整體因素平衡方面占上風。
比巴斯法官在2025判決中用略帶自省和謙遜的語氣解釋為何修正了2023判決。現就法官兩次判決中關于版權侵權及合理使用認定分析對比如下。
1.版權侵權認定三要素的兩次判決對比
(1)關于Westlaw內容版權范圍及有效性
法官在2023判決表示:ROSS公司主張Westlaw注冊版權為匯編作品,包括數十萬個判例摘要和WKNS,僅僅復制幾千個判例摘要不足以構成侵權;ROSS公司的觀點很難得到支持。匯編作品版權延伸到所匯編的受版權保護作品(匯編組件),匯編作者通過原創文字陳述事實,他人可以復制其中基本事實但不能復制呈現事實的確切詞語;匯編組件雖屬于不受版權保護的公共領域,但匯編人對選擇、組織編排材料的方法是有“薄弱”版權,盡管“原創性門檻很低”。因此,WKNS的原創性、是否受保護、受何種保護范圍等爭議由陪審團決定。TR公司主張判例摘要是其律師編輯原創(總結案件重要事實、突出關鍵問題、描述證據),ROSS公司則舉證證明TR公司要求判例摘要“遵循或密切反映判例文書的語言”,此爭議涉及ROSS公司復制的是判例摘要還是判例文書;判例摘要表達了不受版權保護的判例文書,其版權強度取決于判例摘要與判例文書的重疊程度。如果僅是復制判例文書則無版權,若判例摘要是“雕鑿”判例文書且是比“微不足道”更大變化的簡短書面作品,則版權有效。必須在每個判例摘要層面而不是Westlaw匯編層面上考慮判例摘要版權侵權問題。
法官在2025判決認為:版權有效性是法律問題而非事實問題,原創性是版權核心但門檻較低,只要“最低限度的創造力……一些創造性的火花”而非“額頭汗水”。首先,匯編者使用“最低程度的創造力”對事實(判例文書)進行選擇和安排,事實匯編滿足原創標準。其次,不受版權保護的判例文書就像一塊大理石原料,雕刻家通過選擇判斷切鑿掉什么、留下什么,創作成為受版權保護的雕塑;Westlaw編輯律師從冗長判例文書中逐字摘錄形成每份判例摘要,也是從整體中精心挑選和確定重要詞句(如同雕鑿石材原料),并通過提煉、綜合或解釋觀點引入創造性,表達對判例文書重要觀點的想法,這有足夠“創意火花”而具有原創性;且每份判例摘要都是獨立的、受版權保護作品。我改變之前認為原創性取決于判例摘要和判例文書之間重疊程度的錯誤觀點,但不會對任何逐字復制的判例摘要做出簡易判決。組織法律主題、法律問題有許多可能、合乎邏輯、按不同粒度級別的常見方法,TR公司選擇一個特定類型并獨立創建,也具有最低限度的原創性“火花”而無需強調新穎性(novel)。所以,WNKS也是原創的。
(2)關于實際復制問題
法官在2023判決表示:實際復制考察重點是ROSS公司是否使用了受版權保護作品創作自己的作品,真正獨立創作的作品,無論相似性如何都沒有侵權。TR公司可提供直接證據和間接證據——LegalEase承認直接復制了部分判例摘要,ROSS公司不否認LegalEase訪問了Westlaw判例摘要,陪審團也沒有說這些相似之處至少不能證明某些復制。在法律上,ROSS公司實際上復制了判例摘要部分內容。
法官在2025判決認為:在評估復制時我會考慮專家意見;弗雷德里克森專家分析報告指出本批次(3384份)備忘錄的“問題”與判例摘要文本非常相似,且判例摘要與判例文書有很大不同;專家意見表明這些備忘錄“問題”是復制判例摘要,而非通過總結基本觀點所創建,這是有力的實際復制間接證據,陪審團沒有不同結論。因此,LegalEase訪問權加上這些判例摘要的相似性分析,我認定2243份實際復制。
(3)實質性相似問題
法官在2023判決表示:版權侵權認定實質性相似是一個非常接近的事實問題,需要“善于察覺和常識”(good eyes and common sense),要站在普通消費者視角來看待作品差異和美學吸引力。批量備忘錄與判例摘要有共同的潛在來源——判例文書,因此,(a)需要確定ROSS公司的工作與TR公司受保護表達(而非觀點)是否基本相似;(b)雙方產品的普通消費者都是律師,應該適應律師可能注意而外行沒有注意到的差異;(c)第三巡回法院(通常)拒絕專家關于實質性相似意見,所以,我不太關注各方專家對此問題的意見。TR公司所列實質性相似判例摘要是否為受保護的表達,批量備忘錄的問題復制這些判例摘要是否構成侵權,由陪審團裁決。
法官在2025判決認為:作為律師和法官,我也是Westlaw判例摘要的普通用戶,完全有能力確定實質性相似,并對陪審團無法得出相反結論的那些判例摘要進行審查。我采納第九和第二巡回上訴法院有關判例中的概念:作品包含的可保護表達越不容易受到保護,被控侵權作品必須與它越相似。按此標準,2243份判例摘要和批量備忘錄“問題”用語基本相似且如此明顯(而不是判例摘要與判例文書用語相似),這些判例摘要實質性相似。
2.認定合理使用四要素的兩次判決對比
(1)使用的目的和性質
法官在2023判決表示:為盈利的商業性使用不滿足合理使用,而傳達了與原始內容不同的新事物或擴展其效用的轉換性使用有利于增加公共知識,是合理使用。TR公司引用沃霍爾視覺基金訴戈德爾史密斯案,(注9)主張ROSS公司是與Westlaw競爭的商業性使用不是合理使用。ROSS公司描述批量備忘錄轉換處理過程:(a)將接收的批量備忘錄存入數據庫;(b)將簡明語言條目轉化為數字數據;(c)這些數據被輸入機器學習算法用以訓練AI理解法律語言。其AI的核心理念和邏輯在于:通過分析“問題-答案對”(the question-answer pairs)的模式特征不僅能回應預設問題,(注10)還能識別潛在規律,從而應對用戶提出的各類法律問題(即便這些問題在初始訓練數據庫中沒有)并給予反饋。ROSS公司引用世嘉公司訴Accolade案(注11)、索尼公司訴Connectix案(注12)和谷歌訴甲骨文案(注13)等“中間復制”判例,這些判例都使用復制材料作為輸入,但復制材料是為了發現不受保護的信息,或是開發全新產品的一小步,最終輸出是轉換性的,ROSS公司復制用途與判例相似。TR公司認為這些判例的復制者試圖“研究功能或創造兼容性”,而ROSS公司復制Westlaw的創造性內容訓練AI。
法官指出:參照世嘉案、索尼案等“中間復制”判例,使用是否具有轉換性取決于行為的確切性質;按ROSS公司所述,使用判例摘要和觀點引文只是為了分析和學習語言模式而非復制表達,將人類語言“翻譯”成計算機可以理解的東西,生成引用高度相關判例文書回答自然語言問題(且AI輸出不會包含侵權材料),這是開發全新產品的一個步驟,是轉換性使用;但如果ROSS公司復制使用未經轉換的判例摘要和再現 Westlaw律師編輯的創造性成果,那么與世嘉案和索尼案等比較就不合適了。這個事實問題由陪審團決定,ROSS是否主觀惡意并不重要,可忽略。
法官在2025判決中做出修正:本案不同于世嘉案等中間復制判例。首先,這幾個判例都是復制計算機代碼,而ROSS公司從TR公司復制的材料不是計算機代碼。與書籍、影視及其他文學作品的版權不同之處,這些計算機程序幾乎都是用于功能目的,考慮其合理使用因素并不總是適用于復制書面文字情形。其次,“中間復制”計算機編程判例有因素——復制是競爭對手創新的必要條件,而本案沒有。谷歌案的中間復制是“不同程序相互對話所必需”;索尼案的中間復制是對程序中不受保護的功能元素進行逆向工程所必需;世嘉案則是為解決和“發現兼容性的功能要求”而產生中間復制。這些判例一是計算機編程復制判例;二是部分建立在必須通過復制才能獲取(計算機程序)底層邏輯的必要性基礎上。本案不存在計算機代碼的底層邏輯必須通過復制其表達方式才能獲取情形,這種復制對于實現用戶新目的并非合理必要。因此,最高法院在沃霍爾案提出的新框架更適合本案。ROSS公司在此因素上未獲支持并非因其商業性使用,而是其使用沒有“進一步的目的或不同的特征”,不具有轉換性。比巴斯法官特別強調,鑒于AI領域迅猛發展,本判決只是針對本案審理非生成式AI系統所作出的。
(2)受版權保護作品的性質
法官在2023和2025兩次判決對此因素認定基本一致:作品涉及“信息性”而不是更具“創造性”,其合理使用范圍更大;當作品越接近“預期版權保護的核心”,則會得到更多保護。WKNS在法律材料組織方法上即使具有原創性,也只是信息材料的一種安排方式(事實匯編),與傳統文學或視覺藝術作品相比,其創造性或原創性表達要少得多、“想象力”低得多,WKNS不是版權的核心。判例摘要標記出法律要點,較多直接引用判例文書語言并放在段落開頭,盡管編輯們可能已創造性地選擇需要總結的法律觀點并在適當位置附上判例摘要,但這些選擇是受到限制的,遠不如小說家或藝術家從頭開始起草作品的創造力,絕非最具創造性的作品;判例摘要接近但不是非常接近版權保護核心。
(3)使用數量和實質性相似
法官在2023判決表示:復制數量對匯編作品來說不是那么重要;當復制是版權作品創意表達的核心,即便少量也可能超出合理使用范圍,如果復制部分沒有捕捉到作品的創造性表達,大量復制仍可以被視為合理使用。本案復制數量應從每個判例摘要的層級考察,每個判例摘要核心是其原創表達而非與對應判例文書觀點的聯系性。此外,復制的數量也與有效的轉換性使用目的有關,如果侵權作品的表達幾乎沒有傳遞原作的實質性內容,那么就不符合實質性相似標準。原告主張ROSS公司復制的數量遠超它所需,ROSS公司表示它需要大量的多樣性材料訓練其AI。雖然ROSS公司不用證明每個判例摘要都是絕對必要的,但它必須證明復制的規模(如果有的話)事實上是必要的,并進一步推動了其轉換性目標。此因素取決于陪審團。
法官在2025判決認為:本案重要的是ROSS公司由此向公眾提供輸出內容的數量和實質性相似,作為競品,ROSS的AI向最終用戶輸出內容事實上不包括Westlaw判例摘要;ROSS公司使用判例摘要數量和比例不是關鍵,是否使用原作品的核心才是關鍵。ROSS公司在這個因素上獲得支持。
(4)受版權保護作品的潛在市場影響
法官在2023判決表示:無法確定該作品的使用對市場的影響;侵權損失賠償需要考慮原作品市場及衍生作品市場的損害,但并非所有損失都是平等的,還需要考慮“損失的來源”;損失的來源可能不是原作品的表達被挪用,原告假設的銷售損失類型通常也會與不受版權保護的利益有關,轉換性使用促成這一因素。復制越是為了實現與原作品不同的目的,復制作品成為原作替代品的可能性就越小;ROSS公司全新的AI可能是轉換性的而非Westlaw替代品。本案爭議焦點之一是:允許使用受版權保護的材料進行AI訓練是否符合公共利益?即使潛在的好處和風險都很大,各方都會提出合理而有力的解釋,很難獨立評估。判斷保護創作者還是保護復制者更符合公眾利益不僅很危險,也使法院陷入兩難處境。此因素由陪審團決定。
法官在2025判決認為:當前法律研究平臺市場是肯定的,潛在的衍生市場——用于訓練合法AI的數據市場也是顯而易見,并考慮“復制可能產生的公共利益”影響,ROSS公司沒有證據表明這些市場不存在或不會受到影響。TR創建的內容是ROSS公司無法自己創建或聘請LegalEase為其創建而不侵犯TR公司版權的。綜合考慮四因素,比巴斯法官對合理使用作出有利于TR公司的簡易判決。
四、延伸和思考
根據本案雙方主張和兩次判決對比,本文作者有以下幾點思考:
(一)本案ROSS公司的不利因素
1.ROSS公司復制版權作品的事實顯而易見。ROSS公司用于訓練其AI的批量“問題-答案對”中的“問題”,法官認定有2243個是復制Westlaw判例摘要(TR公司稱就是在判例摘要后面加上問號),這些判例摘要是有版權的原創性作品,盡管原創性很低。
2.ROSS公司轉換性使用目的在起訴時未完成,未能充分體現。原告2020年5月起訴時,用戶雖可用自然語言向ROSS提出法律問題,但輸出的答案仍類似傳統搜索引擎的搜索結果方式呈現,(注14)不像Westlaw那樣結構化,也還不能像今天ChatGPT或Deepseek等生成式AI以更接近自然語言方式提供答案。即當時ROSS公司AI系統對Westlaw判例摘要的轉換性使用目的尚未完成,或未能充分體現,如果能再給ROSS一定時間,或不因訴訟影響關閉,其法律AI或能像現今那些性能優秀生成式AI。這是ROSS的不幸。
(二)法官的認識和態度
1.法官對判例與本案差異認識改變是本次判決關鍵。比巴斯法官在2023判決中,參照最高法院認定“中間復制”為合理使用的判例,認為本案復制判例摘要也類似;但法官在2025年判決中意識到軟件程序雖有版權,保護的力度卻不同。如果軟件程序本身是功能性的,復制程序代碼并對其逆向工程是了解該軟件程序的底層邏輯和思想,復制是讓自己的產品能與該軟件/產品兼容,或創造更多不同產品,則這種“思想”復制屬于合理使用。本案從技術角度講有中間復制,但ROSS公司為訓練AI,復制借用的是判例摘要的表達。
2.法官是謹慎和謙抑的。隨著AI技術迅猛發展和廣泛應用,使用版權作品訓練AI過程中是否侵權,合理使用的界限和范式是什么,此問題爭議很大。法官意識到本案判決可能的影響,謹慎而謙抑地提示本判決是依據本案事實所做出的,不適用于生成式AI。
(三)延伸
1.相比于ChatGPT或Deepseek等通用生成式AI,專業領域的垂類AI使用版權作品訓練,可能涉嫌版權侵權的風險更大。
2.使用版權作品訓練AI,“中間復制”和使用的是版權作品的思想,還是版權作品的表達,此過程還需法律、科技界等進行更多探討辨析和定性。如,2023年5月,美國國會舉行的AI與知識產權聽證會上,軟件工程師兼美國版權局前法律總顧問、版權注冊官達姆勒(SY Damle)作證指出,AI模型訓練是將語料集內容分解成離散的片段,通過檢查提取、統計字符的頻率、重要性和彼此之間的語義關系,原始內容/表達已被丟棄。(注15)因此,比巴斯法官對本案此關鍵問題的分析或仍有商榷之處。
3.使用版權作品訓練AI的版權糾紛案中,原告方主張復制侵權、侵權損害等舉證難度很大;隨著AI公司算法優化和風險意識加強,使用版權作品訓練AI產品,其輸出答案與版權作品表達的實質性相似可能會極大減少,被告或更為有利;審理中雙方也許都要大量借助專家證人。
五、結束語
金庸先生武俠小說《倚天屠龍記》中,武功高強的張無忌在靈蛇島初遇波斯人圣火令詭異奇妙功夫,被打得手忙腳亂。危急關頭小昭譯出圣火令武功口訣,“張無忌乍然聽聞,猶如滿天烏云之中,驟然間見到電光閃了幾閃,雖然電光過后,四下里仍是一團漆黑,但這幾下電閃,已讓他在五里濃霧之中看到了出路……隱隱約約的似乎想到了,但似是而非,終究不對”。張無忌又挨一記圣火令擊打,劇痛后“登時心頭雪亮”。
在涉及公共利益的AI技術發展和版權人權利保護之間,如何尋求平衡,產生出普遍適用/認可的新規則,各界都在探索,當下還混沌不清。比巴斯法官的判決“猶如滿天烏云之中驟然間電光驚閃,電光過后雖仍是一團漆黑,但已隱約看到、想到出路”,本判決雖有參考借鑒意義,但還不夠。相信用不了多久,再產生幾個此類案件的經典判例,此爭議問題會“登時雪亮”明晰。
注釋
注1:湯森路透公司官網,https://www.thomsonreuters.com/en/about-us。
注2:westlaw網站,https://www.westlaw.com ? search ? home.html。
注3:大成律師事務所(Dentons)最早投資ROSS公司,
https://www.dentons.com/en/about-dentons/news-events-and-awards/news/2017/october/dentons-nextlaw-labs-helps-first-portfolio-company-secure-millions-in-series-a-funding。
注4:ROSS公司于2021年1月25日關閉業務及網站,https://blog.rossintelligence.com/。
注5:TR公司和WEST公司的起訴狀,
https://storage.courtlistener.com/recap/gov.uscourts.ded.72109/gov.uscourts.ded.72109.1.0_1.pdf。
注6:2023年9月25日,?巴斯法官作出的簡易判決,
https://storage.courtlistener.com/recap/gov.uscourts.ded.72109/gov.uscourts.ded.72109.547.0_5.pdf。
注7:專家弗雷德里克森引入新觀點的專家意見/報告是什么,在?巴斯法官2024年8月2日對專家證人意見的簡易判決中表述并不明確;但根據2025年2月11日簡易判決及檢索相關信息可知,弗雷德里克森是有44年工作經驗的計算機程序專家,在多起重要案件中擔任專家證人,她的專家意見主要涉及分析判定侵權作品與在先版權作品是否實質性相似。專家證人網站關于弗雷德里克森的介紹,
https://expertwitnessprofiler.com/expert-witness/Barbara-Frederiksen-Cross/1552838。
注8:2025年2月11日,比巴斯法官作出的簡易判決,
https://storage.courtlistener.com/recap/gov.uscourts.ded.72109/gov.uscourts.ded.72109.772.0_1.pdf。
注9:美國最高法院裁判沃霍爾視覺基金訴戈德史密斯案[Andy Warhol Foundation for the Visual Arts,Inc. v.Goldsmith,143 S. Ct. 1258(2023)]。1981年,戈德史密斯為已故藝人普林斯(Prince)拍攝肖像照片,并授權雜志《名利場》使用,后《名利場》又委托安迪·沃霍爾基于該照片創作插畫,沃霍爾基于戈德史密斯照片創作絲網印刷、版畫和素描等系作品,并從中選取創作插畫,后交由安迪·沃霍爾基金會(AWF)管理。戈德史密斯認為沃霍爾基金會侵犯版權,沃霍爾基金會稱其作品傳遞了不同于照片的信息和意義,是合理使用。但美國最高法院未支持沃霍爾基金的主張。
注10:the question-answer pairs譯為“問題答案對”“成對問題答案”或“自定義問答”,是AI訓練中一種預設問題,并提供答案以便機器學習和訓練。可參見
https://link.springer.com/article/10.1007/s10489-021-02348-9。
注11:世嘉公司案[Sega Enterprises Ltd. v. Accolade,Inc.,977 F.2d 1510(9th Cir. 1992)] ;世嘉公司(Sega Enterprises Ltd.)是一家視頻娛樂系統和視頻游戲卡帶的開發和營銷商,Accolade,Inc.是一家計算機娛樂軟件開發商,Accolade對世嘉公司的游戲卡帶進行了逆向工程,以使其游戲與世嘉公司的Genesis游戲機兼容而無需被許可,這一過程涉及復制和逆向編譯世嘉公司游戲程序代碼;第九巡回上訴法院裁判中指出,由于計算機程序的性質,如果是為了研究受版權保護的軟件中包含的不受保護的思想,并且如果這是訪問和理解這些思想的唯一途徑,則對計算機程序代碼的反匯編可以屬于合理使用;裁判Accolade不構成版權侵權。
注12:索尼公司案[Sony Computer Entertainment Inc. v. Connectix Corp.,203 F.3d 596 (9th Cir. 2000)];Connectix生產開發的軟件,以允許用戶在他們的計算機上玩Sony PlayStation視頻游戲,索尼公司指控Connectix在其逆向工程過程中復制PlayStation BIOS系統不構成合理使用。法院裁定Connectix在逆向工程中復制索尼公司的程序代碼,第九巡回上訴法院最終裁判Connectix不構成版權侵權。
注13:谷歌訴甲骨文案(Google LLC v. Oracle America, Inc., 141 S. Ct. 1183, Supreme Court 2021);2005 年,谷歌收購Android, Inc.,以便基于Android開發智能手機應用程序,谷歌與Sun Microsystems談判以獲得流行的Java編程語言技術許可,談判未果,谷歌獨立創建Android平臺。為了確保程序員熟悉Java以有助于開發Android應用程序,谷歌從Java API復制了大約11500行代碼(“聲明代碼”),并獨立編寫實際執行該命令的代碼(“實現代碼”),且占谷歌為Android創建API的絕大部分;聲明代碼將程序員鍵入的命令與實際執行該命令的代碼相匹配,聲明代碼還反映了Java的創建者如何“安排和分組”不同的任務。美國最高法院從合理使用四因素分析認為谷歌的復制在法律上屬于合理使用。
注14:鑒于ROSS系統已于2021年1月關閉無法再現,本文作者根據原告起訴狀附圖所示推測認為:在2020年5月起訴時,對于用戶用自然語言提出法律問題,ROSS公司AI所輸出答案仍類似傳統搜索引擎的結果的展現,當時尚不能像今天ChatGPT或Deepseek等生成式AI,以更接近于自然語言的方式輸出回答;因此,起訴時ROSS公司AI系統較當時的Westlaw,還未能充分展現“變革性”或“轉換性”。本文作者此推測或有誤,請讀者自行斟酌。
注15:2023年5月1日-7日,美國國會眾議院司法小組委員會舉行“人工智能與知識產權”聽證會,軟件工程師、美國版權局前總法律顧問和版權注冊官、Latham & Watkins LLP律師事務所合伙人達姆勒(SY DAMLE)作證,
https://judiciary.house.gov/sites/evo-subsites/republicans-judiciary.house.gov/files/evo-media-document/damle-testimony.pdf。
(本文僅代表作者觀點,不代表知產力立場)
封面來源 | Pexels 編輯 | 有得
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.