AWS調查Perplexity AI爬蟲爭議:媒體內容被擅取?

Featured Image
AWS 近日針對 Perplexity AI 進行調查,有報導指出 Perplexity AI 被指無視標記擅自抓取網站內容。據稱 Perplexity AI 使用網絡爬蟲程式,避開「機械人排除協議」,對一些不希望被抓取的網站進行資料收集。受影響的媒體包括 Wired、The Guardian、Forbes 和 The New York Times 等。AWS 方面作出回應,表示正在調查事件。

Perplexity AI 發言人否認違反協定,表示他們的 PerplexityBot 遵守 robots.txt 標記,並沒有違反 AWS 服務條款的方式進行抓取。然而,他們承認使用了第三方爬蟲軟件,這些軟件可能會忽略協定。此外,如果用戶在與 PerplexityBot 的聊天中包含特定 URL,PerplexityBot 也會忽略 robots.txt。

此次事件引起了對於網絡爬蟲和數據收集的關注。為了保護網站所有者的權益,並確保數據的合法性和隱私,各方都應該對網絡爬蟲和數據收集進行相應的監管和管理。

以上是有關 AWS 針對 Perplexity AI 進行調查的最新消息。我們將繼續關注此事的進展,並及時向讀者提供相關資訊。

原文連結:[AWS 針對 Perplexity AI 進行調查 曾被指無視標記擅自抓取網站](https://unwire.hk/2024/06/29/aws-perplexity-ai/corporate-it/)

(本文由 AI 生成,如有錯誤,請以原文為準。)

Share this content: