內容創作者看過來!網路爬蟲的法律雷區,你踩到了嗎?
在這個資訊爆炸的時代,內容創作者們常常需要大量資料來支持創作、分析趨勢,甚至開發新的服務。網路爬蟲(Web Crawler)無疑是獲取這些資料的強大工具。然而,在按下「執行」鍵的那一刻,您是否曾停下來思考:這樣抓取資料,會不會有法律問題?
別擔心!身為您的法律與行銷顧問「律點通」,我將深入淺出地為您解析網路爬蟲可能面臨的著作權法與個人資料保護法兩大法律風險,並提供實用的操作建議,讓您在創作路上安心前行。
一、著作權法:資料抓取,小心別「重製」了他人的心血
當您使用網路爬蟲抓取網站內容時,最直接的風險就是可能侵害他人的著作權。著作權法保護的是具有「原創性」的「表達」,而非單純的「事實」或「資訊」。
首先,我們要了解什麼是「著作」:
《著作權法》第3條第1項第1款:「著作,指屬於文學、科學、藝術或其他學術範圍之創作。」
這表示,您抓取的內容必須具備一定的原創性,才能受到著作權法保護。例如,一篇文章的文字、一張攝影作品、一段影片,都可能構成著作。
而爬蟲最常觸及的行為,就是「重製」:
《著作權法》第3條第1項第5款:「重製,指以印刷、複印、錄音、錄影、攝影、筆錄或其他方法直接、間接、永久或暫時之重複製作。」
簡單來說,當您的爬蟲將網頁上的文字、圖片、影音等內容下載、儲存到您的伺服器或電腦時,無論是暫時性還是永久性,都可能構成「重製」行為。若未經著作權人同意,就可能侵害其「重製權」。
此外,如果您將抓取到的內容再次上傳到自己的網站或平台,供公眾瀏覽下載,這就可能構成「公開傳輸」:
《著作權法》第3條第1項第10款:「公開傳輸,指以有線電、無線電之網路或其他通訊方法,藉聲音或影像向公眾提供或傳達著作內容,包括使公眾得於其各自選定之時間或地點,以上述方法接收著作內容。」
若您未經授權就進行重製或公開傳輸,依據《著作權法》第91條及第92條,可能面臨刑事責任,處三年以下有期徒刑、拘役,或科或併科新臺幣七十五萬元以下罰金。
重點提醒: 即使是資料庫,若其資料的「選擇及編排」具有獨特的創作性,也會被視為「編輯著作」受到保護。《著作權法》第7條第1項便明定:「就資料之選擇及編排具有創作性者為編輯著作,以獨立之著作權保護之。」
二、個人資料保護法:公開資料,不代表可以隨意使用
除了著作權,網路爬蟲最容易踩到的地雷就是「個人資料保護法」(簡稱個資法)。許多網站上都包含用戶的公開資訊,這些資訊一旦被爬取,就可能構成個資法的風險。
首先,我們要清楚什麼是「個人資料」:
《個人資料保護法》第2條第1款:「個人資料,指自然人之姓名、出生年月日、國民身分證統一編號、護照號碼、特徵、指紋、婚姻、家庭、教育、職業、病歷、醫療、基因、性生活、健康檢查、犯罪前科、聯絡方式、財務情況、社會活動及其他得以直接或間接方式識別該個人之資料。」
只要是能「直接或間接識別」特定自然人的資訊,都屬於個資法的保護範圍。這包括姓名、電話、email、住址,甚至是社群媒體上的公開貼文、留言,只要能連結到特定個人,都可能是個人資料。
網路爬蟲抓取、儲存、整理這些資料的行為,就分別構成個資法所稱的「蒐集」、「處理」與「利用」:
- 蒐集:以任何方式取得個人資料。
- 處理:為建立或利用個人資料檔案所為資料之記錄、輸入、儲存、編輯、更正、複製、檢索、刪除、輸出、連結或內部傳送。
- 利用:將蒐集之個人資料為處理以外之使用。
身為非公務機關的內容創作者或公司,您蒐集、處理或利用個人資料時,必須遵守「特定目的」原則,並具備合法的基礎:
《個人資料保護法》第19條第1項:「非公務機關對個人資料之蒐集或處理,除第六條第一項所規定資料外,應有特定目的,並符合法律明文規定、與當事人有契約或類似契約關係、當事人自行公開或其他已合法公開之個人資料、經當事人同意等情形之一。」
這表示,您必須有明確且合法的目的才能蒐集個資,且不能超出該目的範圍去利用資料。
《個人資料保護法》第20條第1項:「非公務機關對個人資料之利用,除第六條第一項所規定資料外,應於蒐集之特定目的必要範圍內為之。但有法律明文規定、為增進公共利益所必要、經當事人同意等例外情形,得為特定目的外之利用。」
若您違反上述規定,且有「意圖為自己或第三人不法之利益或損害他人之利益」,並「足生損害於他人」時,依據《個人資料保護法》第41條,可能面臨五年以下有期徒刑,得併科新臺幣一百萬元以下罰金。
三、真實案例看分明:爬蟲行為的法律界線
透過實際案例,更能理解法律的適用情境:
案例一:房產資訊平台大戰,資料庫有無著作權?
小明經營一個房產資訊整理平台,他開發爬蟲程式,從政府公開資料及各大房仲網站上,抓取房屋的地址、價格、樓層、屋齡等公開資訊,整理成自己的資料庫。某天,另一家大型房仲業者指控小明侵害其「編輯著作」的著作權。
法院怎麼說? 智慧財產及商業法院在類似案件中指出,單純蒐集並羅列公開的事實性資料,若在資料的選擇及編排上,難以看出獨特的創意或作者的個性,即使投入了大量時間與精力,也難以被認定為受著作權法保護的「編輯著作」。因此,小明的行為可能不構成著作權侵害。
案例啟示: 抓取公開的客觀事實性資料,若原網站的資料庫本身缺乏「選擇與編排的創作性」,則爬取行為較難構成著作權侵害。著作權法保護的是「創意」,而非「勞力」的投入。
案例二:新創人力顧問公司,踩到個資法的紅線!
一家新創人力顧問公司為了節省成本,以虛設公司的名義,與某知名人力銀行平台簽約,取得資料庫使用權限。然而,他們並非為了合約中約定的「招募人才」目的,而是非法下載了近萬筆求職者的個人履歷資料,轉寄給員工進行人力仲介業務,規避了更高的服務費用。
法院怎麼說? 臺灣高等法院在類似案件中認定,該公司的行為已超出與人力銀行簽約時的「特定目的」,且其取得資料的方式存在欺瞞,不符合個資法第19條第1項所規定的合法事由。因此,法院判決被告構成《個人資料保護法》第41條的非法蒐集、處理、利用個人資料罪。
案例啟示: 即使是看似「合法」取得的資料(例如透過簽約),若其取得方式不誠實,或後續利用超出原先約定的「特定目的」,且有「意圖不法利益」時,仍會構成嚴重的個資法侵害。這對內容創作者而言,意味著即使資料來源是公開的,也不能隨意用於任何目的,特別是涉及個人資料時。
四、給內容創作者的實務操作指引
為了避免不必要的法律風險,請您務必遵守以下原則:
著作權法方面
- 評估資料的原創性: 在抓取前,先判斷目標網站的內容是否具有原創性。單純的客觀事實、數據、公文等通常不具著作權。但文章、圖片、影音、獨特設計的資料庫等,則很可能受保護。
- 避免直接重製受保護內容: 盡量不要直接下載、儲存受著作權保護的文字、圖片、影音。若有需求,務必取得著作權人的合法授權。
- 謹慎使用超連結與嵌入:
- 超連結: 單純提供超連結至合法網站,風險較低。但若明知連結指向侵權內容,仍提供連結,可能構成「幫助侵權」。
- 嵌入(Embedding): 若使用嵌入式語法,內容仍由原始網站提供,且未實質重製,風險可能較低。但若嵌入的目的是規避著作權保護,或實質上提供侵權內容,仍應避免。
- 尊重網站使用條款與robots.txt: 許多網站會在其使用條款中限制爬蟲行為,或透過
robots.txt檔案指示爬蟲程式不應抓取的範圍。雖然robots.txt不具法律強制力,但無視其指示可能被視為惡意行為,增加法律風險。
個人資料保護法方面
- 確立「特定目的」: 若爬取到的資料包含個人資料,必須確保您蒐集、處理、利用這些資料有明確且合法的「特定目的」,且不得超出該目的之必要範圍。
- 尋找合法蒐集基礎: 依據個資法第19條,即使資料已由當事人「自行公開」或「合法公開」,仍需評估當事人是否有「更值得保護之重大利益」而禁止處理或利用。這代表「公開」不等於「自由使用」,仍需謹慎。
- 避免「不法利益或損害他人利益」: 這是構成個資法刑事責任的關鍵。在利用個人資料時,應避免產生任何為自己或第三人謀取不法財產利益,或損害他人財產或非財產利益的意圖。
- 加強資料安全措施: 對於蒐集到的個人資料,應採取嚴格的安全措施,防止資料被竊取、竄改、毀損、滅失或不當利用。
五、結論:知法守法,讓您的創作更有價值
網路爬蟲是內容創作者的利器,但同時也伴隨著潛在的法律風險。了解著作權法與個人資料保護法的基本原則,並在實際操作中遵守這些規範,不僅能保護您自己免於法律糾紛,更能提升您內容的合法性與公信力。
記住,「知法守法」是所有創作者在數位時代不可或缺的素養。在享受資料便利性的同時,也請務必尊重他人的智慧財產與個人隱私,讓您的創作之路走得更穩健、更長遠!
常見問題快速解答
Q: 我只是抓取公開的商品資訊、價格來做比價網站,會被著作權法罰嗎?
A: 這要看您抓取的商品資訊和價格,在原網站上是否有「選擇及編排的創作性」。如果只是單純羅列客觀事實(例如商品名稱、型號、價格等),通常這些資訊本身不具備著作權,您的比價網站也較難構成著作權侵害。但若原網站的商品頁面有獨特的設計、文案、圖片等,且您直接重製這些內容,就可能構成侵害。建議您只抓取必要的事實性資料,並以自己的方式呈現,避免直接複製網站的視覺元素或文案。
Q: 如果我只是抓取圖片或影片的「超連結」或「嵌入碼」,並在我的網站上呈現,會侵權嗎?
A: 單純提供超連結至合法網站,通常不構成著作權侵害。至於嵌入(embedding),如果只是使用嵌入碼讓原始影片或圖片在您的網站上播放,但內容仍由原始網站提供且未實質重製,風險可能較低。然而,這並非絕對安全。如果連結或嵌入的內容本身是侵權物,且您明知或可得而知,仍提供連結或嵌入,則可能被視為「幫助侵權」。此外,若您的嵌入行為有規避原始網站保護措施、或實質上擴大侵權內容散布的意圖,也可能構成問題。建議您務必確認連結內容的合法性,並避免任何規避著作權保護的行為。
Q: 網站有robots.txt檔案,我一定要遵守它的指示嗎?不遵守會有法律問題嗎?
A: robots.txt檔案是網站管理者向網路爬蟲發出的「君子協定」,它指示哪些頁面不應該被爬取。雖然robots.txt本身不具備法律強制力,不遵守它通常不會直接構成著作權或個資法侵害。然而,無視robots.txt的指示,可能被視為「惡意爬取」或「不正當競爭」行為,增加網站對您採取法律行動的風險,例如以民法侵權行為、妨害電腦使用罪(若有規避技術保護措施)或違反網站使用條款等名義提告。為了維護良好的網路生態並降低風險,強烈建議您尊重並遵守網站的robots.txt指示。
Q: 我用爬蟲抓到一些公開的個人資料(例如社群媒體上的公開貼文、留言),我只是用來做市場分析,沒有要營利,這樣可以嗎?
A: 即使資料是「公開」的,在個資法上仍有其限制。個資法第19條第1項第7款允許非公務機關蒐集來自「一般可得之來源」的個人資料,但有個但書:「當事人對該資料之禁止處理或利用,顯有更值得保護之重大利益者,不在此限」。這表示,即使資料公開,當事人仍可能基於隱私權等重大利益,要求您不得處理或利用。此外,您蒐集、處理、利用這些資料必須有「特定目的」,且不得超出該目的範圍。若您僅用於內部市場分析,且未涉及識別特定個人、公開或轉售等,風險相對較低,但仍需謹慎評估是否侵害當事人權益。若您的分析結果可能間接識別個人,或影響到當事人權益,則仍有觸法風險。建議對個資進行去識別化處理,並確保沒有「意圖不法利益或損害他人利益」的主觀要件。
※ 網站聲明
著作權由「律點通」所有,非經正式書面授權,不得任意使用。
資料內容皆由AI生成,僅供參考,所引用資料也請自行查核法令動態及現行有效之實務見解,不宜直接引用為主張或訴訟用途,具體個案仍請洽詢專業律師。
