法源(Lawbank)訴七法(Lawsnote)案簡析
目錄
一、數位時代的資料戰爭與法律邊界
1. 研究背景與問題意識
在當代數位經濟體系中,數據(Data)被廣泛視為驅動創新與經濟成長的新石油。隨著人工智慧(AI)、機器學習(Machine Learning)以及大數據分析技術的飛速演進,如何高效、合法地取得大量數據,已成為科技公司——特別是法律科技(LegalTech)與金融科技(FinTech)業者——建立核心競爭優勢的關鍵。然而,數據並非天然存在的公共財,許多高價值的結構化數據往往掌握在既有的市場先行者手中。後進者為了打破數據壟斷、訓練更精準的模型或提供更優質的服務,往往利用網路爬蟲(Web Scraping)技術進行自動化資料蒐集。這種技術手段在帶來效率的同時,也不可避免地觸發了與原資料持有者之間的法律衝突。
臺灣新北地方法院於 2025 年針對「七法股份有限公司(Lawsnote)訴法源資訊股份有限公司(Lawbank)」一案所做出的刑事判決(111 年度智訴字第8號)及隨後的刑事附帶民事判決(112 年度智重附民字第1號),不僅是台灣司法史上針對網路爬蟲技術與資料庫保護最具指標性的判決,更在全球 AI 法律規範尚未定於一尊之際,提出了一套極具爭議性與深遠影響力的法律見解 。本案判決結果——被告遭判處有期徒刑並需賠償新臺幣1億545萬餘元——震驚了台灣新創圈與法律界 。
本報告旨在立足於「法律專家」之視角,依據分析事實、蒐集法律依據、涵攝法律、提出結論之嚴謹流程,對本案進行窮盡式的深度剖析。報告將特別聚焦於著作權法「合理使用」(Fair Use)原則與刑法第359條「無故取得電磁紀錄」罪之間的法律解釋互動。這兩者在傳統法學上分屬民事與刑事領域,但在本案中卻發生了劇烈的化學反應:民事上的侵權認定似乎成為了刑事定罪的基礎,而刑事的處罰又反過來強化了資料庫的財產權邊界。透過解析此一互動關係,並援引美國 Thomson Reuters v. Ross Intelligence 案及 HiQ v. LinkedIn 案,以及日本《著作權法》第 30 條之 4 的立法例,本報告將試圖為台灣 AI 產業在合規與創新之間尋找可能的出路。
二、Lawbank 訴 Lawsnote 案
1. 當事人與市場結構分析
- 原告(告訴人):法源資訊股份有限公司(Lawbank)
法源資訊成立於 1980 年代,是台灣最資深且市佔率最高的法學資料庫業者之一。其核心產品「法源法律網」彙整了台灣數十年來的法規、判決、行政函釋及法學論著,長期以來是法律從業人員(律師、法官、檢察官)不可或缺的工具 。法源資訊的商業模式建立在「會員訂閱制」與「資料授權」之上,其競爭優勢在於資料的完整性、即時性以及經過長年人工整理的加值資訊(如法規沿革的校對、判決書的超連結編排)。 - 被告:七法股份有限公司(Lawsnote)
AI 訓練資料集(如 Common Crawl)包含數以兆計的網頁,涉及無數的文字、圖片、影片著作權人。智慧財產局承認,由於權利歸屬分散(權利碎片化),開發者根本不可能逐一取得授權 1。這導致AI開發者面臨一種「全有或全無」的風險:要麼完全不使用受保護的資料(導致模型無用),要麼冒著侵權風險使用。
2. 關鍵行為與技術手段之深度還原
依據判決書及相關報導,本案的爭議行為發生於 2018 年至 2019 年間。為了快速充實自身資料庫以具備與法源資訊競爭的基礎數據,Lawsnote 採取了自動化手段進行資料抓取。
- 爬蟲程式的運作機制
Lawsnote 的工程團隊撰寫了六組網路爬蟲程式(Web Crawlers),針對法源法律網進行高頻率的自動化訪問 。- 目標標的:主要鎖定法源網站上的「法規沿革」、「法規內容」及「法規附件」。這些資料雖然源自政府公報,但法源資訊將其數位化並進行了結構化編排。
- 數據量級:總計成功下載了超過 33 萬筆資料,其中包括約 9 萬 8 千筆的法規沿革資料 。
- 技術特徵:爬蟲程式模擬了 HTTP 請求,直接讀取網頁原始碼(HTML),並透過解析器(Parser)提取所需的文字內容與結構化資訊。
- 攻防技術的升級:規避與對抗
本案之所以被法院認定具有較高的可歸責性,關鍵在於雙方在技術上的攻防過程。- 第一階段(阻擋):法源資訊的伺服器監測到來自特定 IP 位址的異常高流量請求(遠超人類閱讀速度),隨即啟動防火牆機制,封鎖了這些 IP 的存取權限。此外,法源網站亦設有 robots.txt 協定,聲明禁止爬蟲程式的訪問 。
- 第二階段(規避):在遭遇 IP 封鎖後,Lawsnote 並未停止抓取,而是升級了爬蟲技術。被告透過更換 IP 位址(IP Rotation)以及偽裝 User-Agent(模擬一般瀏覽器的標頭資訊)等手段,繞過法源的封鎖機制繼續進行資料下載 。
- 資料的使用與商業化
Lawsnote 將抓取到的資料進行格式轉換與清洗後,匯入自身的資料庫系統。這些資料成為 Lawsnote 提供付費會員搜尋服務的基礎內容。換言之,Lawsnote 直接使用了法源的資料來與法源進行商業競爭,且其服務價格可能低於法源,形成價格競爭壓力 。
3. 損害計算基礎:勞力成本的貨幣化
在附帶民事訴訟中,法院對於賠償金額的計算方式極具爭議性且值得深入探討。法院判決被告應連帶賠償新臺幣 1 億 545 萬 1644 元,此金額並非基於 Lawsnote 的獲利,而是基於法源資訊的「建置成本」 。
表 2.1:損害賠償金額計算依據表
| 資料類型 | 單位成本認定(時間) | 涉及筆數 | 計算邏輯 |
|---|---|---|---|
| 法規沿革 | 每筆 7 分鐘 | 約 98,068 筆 | 人工蒐集、校對、打字、編排所需時間 |
| 法規內容 | 每筆 30 分鐘 | 約 102,520 筆 | 含條文內容核對、超連結設定等工時 |
| 法規附件 | 每筆 22 分鐘 | 約 130,936 筆 | 掃描、修圖、轉檔等處理時間 |
| 總計 | 總工時 x 時薪 = 1億545萬餘元 | 總計約 33 萬筆 | 將歷史投入的勞力直接轉化為損害賠償額 |
4.「合理使用(Fair Use)」抗辯的法律攻防
| 判斷基準 | AI / 爬蟲業者的主張(攻) | 著作權人的主張 / 法院傾向(防) |
|---|---|---|
| 1. 利用之目的及性質 | 主張為「轉化性使用(Transformative Use)」。TDM 是為了分析數據模式、提取事實,而非單純複製原著作的表達供人欣賞。且AI具有促進科技進步之公益性。 | 若AI服務是商業營利性質(如付費 API、訂閱制),合理使用的空間將大幅壓縮。法院常認為商業目的之利用較難主張合理使用 3。 |
| 2. 著作之性質 | 爬取對象多為事實性資訊(如新聞報導、法規、數據),事實不受著作權保護,故保護密度較低。 | 若爬取的是高度原創性的美術著作、攝影著作或具創意編排的資料庫(如法源法律網),則保護密度高,合理使用空間小。 |
| 3. 利用之質量及其在整體著作之比例 | 相對於整個網際網路,爬取的僅是滄海一粟;或雖全篇複製,但僅是作為龐大資料庫的一小部分。 | 機器學習通常需要輸入「完整」的著作(全量使用)。全篇複製通常被認為超出了合理範圍,除非證明有絕對的技術必要性。 |
| 4. 利用結果對潛在市場與現在價值之影響 | AI 創造了全新的市場(如生成式創作),並未取代原著作的市場。 | 若 AI 生成的內容或提供的搜尋服務「替代」了原著作的市場需求(例如使用者問 AI 就不去看新聞原網頁,導致媒體廣告收入下降),則對潛在市場造成重大損害,極難成立合理使用 5。 |
此種計算方式顯示,法院在認定損害時,採取了完全填補「過去勞力投入」的觀點,而非評估「市場替代效應」或「授權金損失」。這在法理上引發了是否變相承認「辛勤原則」(Sweat of the Brow)的疑慮。
三、編輯著作、原創性與事實壟斷
本案在著作權法上的核心爭點,在於法源資訊網站上的「法規沿革」是否構成受保護的「編輯著作」。若法規沿革僅是單純事實的羅列,則不具著作權;若具備原創性,則 Lawsnote 的重製行為即構成侵權。
1. 編輯著作之保護要件與「微量創意」標準
依據著作權法第 7 條第 1 項規定:「就資料之選擇及編排具有創作性者為編輯著作,以獨立之著作保護之。」此條文確立了資料庫受保護的前提在於「選擇」與「編排」必須體現作者的精神創作 。
台灣法院在實務上對於「創作性」(Originality)的認定,多採行「微量創意」(Minimal Requirement of Creativity)標準。這意味著,作品不需要達到前無古人的創新高度,只要能展現作者些許的個性或獨特選擇,非完全機械式的排列,即可受保護 。
2. 法院對「法規沿革」原創性之涵攝
在本案判決中,法院詳細比對了法源網站與政府官方網站(如立法院法律系統、總統府公報)的差異,最終認定法源的「法規沿革」具有原創性。法院的論理邏輯如下:
- 非機械式操作:法源公司並非單純執行「複製、貼上」政府公報。其編制過程涉及專業人員從龐雜的令函、公報中「蒐集」、「篩選」出與法規變動相關的資訊 。
- 獨特的編排表達:法院指出法源在資料呈現上有其獨特的編輯規則,這些規則體現了編輯者的思維:
- 日期格式:採用特定的「國字」與「數字」混用規則(例如:中華民國〇〇年〇〇月〇〇日)。
- 加註資訊:對於發文機關與字號,有特定的加註方式與括號使用習慣。
- 更名標示:明確列出法規的「原名稱」與「新名稱」對照,方便使用者理解法規流變。
- 排序邏輯:採用「由新至舊」的逆序排列,以符合法律人查閱最新修法的需求 。
法院認為,這些細節的累積,使得法源的法規沿革在「外觀」與「結構」上與官方資料有所區別,展現了編輯者的選擇與編排創意,因此屬於受保護的語文編輯著作。
3. 批判性分析:辛勤原則的幽靈與合併原則的適用
儘管法院試圖用「微量創意」來證成判決,但學界與實務界對於此判決是否過度保護了「事實」仍有諸多質疑。
- 辛勤原則(Sweat of the Brow)的實質回歸
美國最高法院在 1991 年 Feist Publications, Inc. v. Rural Telephone Service Co. 案中,明確廢棄了「辛勤原則」。該案指出,單純投入大量勞力、資金蒐集事實(如電話簿),若無創意編排,不應受著作權保護,以免造成事實壟斷 。 然而,在本案中,法院雖然口頭上依循原創性標準,但在損害賠償計算上卻完全依賴「人力工時」(每筆 7 分鐘),這強烈暗示了法院心證中對於「被告不勞而獲(Free Riding)剽竊原告辛苦成果」的道德非難 。這種「保護勞動」而非「保護表達」的邏輯,實質上讓辛勤原則在台灣司法實務中藉屍還魂。 - 思想與表達合併原則(Merger Doctrine)之挑戰
Lawsnote 抗辯指出,法規沿革是描述法律變動歷程的客觀事實,其表達方式受到「時間軸」與「法規內容」的嚴格限制。當一種思想(法規變動歷史)只有極少數幾種表達方式時,該表達方式應與思想合併,不受著作權保護 。 法院駁回此抗辯的理由是:市場上還有其他法學資料庫,其對法規沿革的描述與法源不同。既然有「不同」,就代表表達方式「不只一種」,故不適用合併原則。 分析:此論點值得商榷。法規沿革的核心在於「準確傳達變動資訊」,其日期、字號、機關名稱均為不可更動的事實。所謂的「不同」往往僅是字型、標點或些微格式的差異。若將這些微小的格式差異視為「創意」並給予強保護,將導致後進者為了避開侵權,必須故意採用「較不直觀」或「較不通順」的表達方式,這反而阻礙了資訊的有效傳遞。
四、刑法第 359 條「無故」要件的擴張與爭議
本案最令人震驚的並非鉅額賠償,而是將網路爬蟲行為定性為刑法第359條的「無故取得電磁紀錄罪」,並判處創辦人有期徒刑。此判決將民事違約(違反網站 ToS)直接升級為刑事犯罪,劃下了一條極為嚴厲的紅線。
1. 刑法第 359 條之構成要件
刑法第 359 條規定:「無故取得、刪除或變更他人電腦或其相關設備之電磁紀錄,致生損害於公眾或他人者,處五年以下有期徒刑...。」
實務上,本條關鍵爭點往往集中在何謂「無故」。最高法院曾在 110 年度台上字第 90 號判決中,將「無故」定義為「無正當權源或正當事由」。具體情境包括:
- 未經所有人許可。
- 無處分權限。
- 違反所有人意思。
- 逾越授權範圍 。
2. 法院認定 Lawsnote 構成「無故」之理由
在本案中,法院認定 Lawsnote 的爬蟲行為構成「無故」,其理由如下:
- 違反使用規範(ToS)即違反所有人意思:法院指出,法源網站的使用條款(Terms of Service)已明文禁止使用自動化程式(爬蟲)擷取資料。由於 Lawsnote 創辦人郭榮彥律師曾註冊為法源會員,理應知悉此條款。因此,其後續的爬取行為明顯違反了網站管理者的意思。
- 技術規避視為惡意證據:法源網站在偵測到異常流量後,採取了 IP 封鎖措施。Lawsnote 隨後使用更換 IP、偽裝 User-Agent 等技術繞過封鎖。法院認為,這些規避行為證明了被告「明知其無權限」卻「強行存取」,進一步坐實了「無故」的主觀犯意。
3. 致生損害之認定
法院認為,七法的行為導致法源喪失了對其資料庫的「獨占支配權」,且 Lawsnote 利用這些「無償取得」的資料進行低價競爭,造成法源潛在的商業利益損失(如會員流失、授權金損失),符合「致生損害」之要件 。
4. 民事違約刑事化的法理危機
此判決在學界與科技界引發了強烈反彈,核心批評在於法院過度擴張了刑法的適用範圍,違反了刑法作為「最後手段」的謙抑原則。
刑事責任「無故入侵」理應在防範無「存取權限(Access)」之情事,例如資料庫設有密碼,外來侵入者未經許可進入資料庫內,取得、刪除或變更設有權限之資料。然而,法源網站本質上是一個公開網站,任何人只要連上網際網路,均可瀏覽其公開頁面(即便部分內容需登入,但爬取標的若為公開可見者,性質不同)。從技術本質來看,網路爬蟲發送的是標準的 HTTP 請求(GET Request),與人類使用瀏覽器(Chrome, Edge)的行為完全一致,其中之差別僅在於「頻率」與「速度」。換言之,透過網路爬蟲發送HTTP GET請求瀏覽、取得法源網站瀏覽其對外公開之資訊,應非刑事上所要防範的「存取權限」問題,而僅是「使用方式(Usage)」違反 ToS 中「禁止爬蟲」的使用規範,而 ToS 使用規範性質上應僅是民事定型化契約,應屬民事糾紛,而非刑事入侵。
台灣法院在本案中的見解顯得極為保守且嚴厲,將網站 ToS 視為刑罰權的觸發機制,這可能導致網站經營者單方面定義刑事犯罪邊界的風險。
五、著作權法「合理使用」與刑法「無故」之交織
本報告認為,本案最具法理深度的觀察點,在於著作權法上的「合理使用」抗辯失敗,如何成為刑法上「無故」認定的關鍵支撐。這兩者在判決邏輯中形成了一個相互強化的閉環。
1. 著作權法「合理使用」的審查
被告 Lawsnote 主張,其爬取資料是為了建立搜尋引擎,屬於轉化性使用(Transformative Use),有助於公共利益(讓法律資訊更易檢索),應構成著作權法第 65 條第 2 項的合理使用。 然而,法院引用了美國 Thomson Reuters v. Ross Intelligence 案的見解,駁回了此抗辯 。
表:合理使用四要素之法院認定分析
| 合理使用要素 | 法院認定觀點 | 對被告不利之理由 |
|---|---|---|
| 1. 利用之目的及性質 | 商業目的 | Lawsnote 為營利公司,收取會員費。雖然搜尋引擎具公益性,但其商業競爭本質強烈。 |
| 2. 著作之性質 | 編輯著作 | 認定法規沿革具原創性,屬受保護著作。 |
| 3. 利用之質量及其在整個著作之比例 | 100% 重製 | Lawsnote 下載了完整的法規沿革資料庫,並非部分引用,而是全面複製。 |
| 4. 利用結果對著作潛在市場與現在價值之影響 | 市場替代(Market Substitute) | (最關鍵) Lawsnote 的服務直接與法源競爭。若允許此行為,使用者將轉向 Lawsnote,直接侵蝕法源的訂閱與授權市場。 |
2. 刑法「無故」的補強邏輯
在確認「不構成合理使用」後,法院在刑法論罪時,實質上運用了這個結論來填補「無故」的內涵:
- 因為侵權,所以無故:既然被告的行為在民事上已被認定為侵害著作權(不構成合理使用),那麼被告在存取資料時,自然就缺乏「正當法律權源」。
- 尊重「機器可讀」的退出機制法院隱含的邏輯是,為了商業競爭而未經授權使用他人資產,在道德上具有可非難性。這種可非難性(Blameworthiness)被轉化為刑法上的「無正當理由」。
3. 互動效應的危險性:寒蟬效應的加乘
這種「民事侵權 => 刑事無故」的推論模式,對 AI 產業產生了巨大的寒蟬效應。
- 合理使用的不確定性:合理使用本身是一個高度依賴個案判斷(Case-by-case)的模糊標準。AI 開發者在訓練模型前,往往難以百分之百確定是否構成合理使用。
- 刑事風險的不可承受性:在過去,若合理使用抗辯失敗,後果是民事賠償。但在本案的邏輯下,一旦合理使用抗辯失敗,就可能直接落入刑法第 359 條的「無故取得」,面臨牢獄之災。
- 結論:這種連動機制迫使 AI 業者在面對任何不確定性時,只能選擇「不使用」或「付費」,因為刑事責任的賭注太高。這實質上賦予了資料擁有者極大的議價能力,甚至可能造成數據壟斷。
六、對 AI 時代遵法的影響
Lawbank v. Lawsnote 案的判決結果,標誌著台灣司法在數位資料權利保護上採取了「強財產權保護」與「契約刑罰化」的立場。首先,透過對編輯著作原創性的寬鬆認定,以及高額的勞力成本賠償,法院確立了資料庫建置者的權益神聖不可侵犯。再者,法院明確宣示違反網站 ToS 並繞過技術阻擋的爬蟲行為,將面臨刑事責任。然而,此案判決對於新興發展的AI產業,無疑是投下了一顆有如核彈衝擊的震撼彈。
對於正在蓬勃發展的台灣生成式 AI 與 LLM 產業,本案帶來了下列嚴峻的挑戰:
- 訓練資料取得的法律地雷:AI 模型訓練需要海量數據。若依此判決,AI 業者在爬取網頁時,必須逐一檢視成千上萬個網站的 robots.txt 與 ToS。只要網站聲明禁止爬蟲,蒐集行為即可能構成犯罪。這在實務上幾乎使得大規模的繁體中文語料庫建置成為不可能的任務 。
- 本土模型發展的劣勢:相較於日本或歐盟(有 TDM 例外),台灣 AI 業者面臨更高的法律成本與刑事風險,恐導致本土模型在數據量與品質上落後國際 。
Lawsnote 案雖然在個案中懲罰了「搭便車」的競爭行為,但也意外地為台灣 AI 產業設下了高聳的法律圍牆。如何在保護智慧財產與促進數據流通之間取得新的平衡,將是台灣法律體系在 AI 時代必須面對的終極課題。