AWS調查Perplexity AI涉嫌無視協議擅取網站數據事件 - siuleeboss

2024-06-30

siuleeboss

AWS 近日對 Perplexity AI 進行調查，因其被指無視標記擅自抓取網站內容，引發爭議。據報導，AWS 正在調查 Perplexity AI 是否使用網絡爬蟲程式，避開 robot.txt「機械人排除協議」，從而對不希望被爬蟲抓取內容的網站進行資料收集。此前有媒體發現，Perplexity AI 多次存取被排除的網站內容，忽略了網站上的 robot.txt 協議。這些網站包括 Wired、The Guardian、Forbes 和 The New York Times 等。由於虛擬機器是在 AWS 上託管的，因此 AWS 也對此事做出回應。

Perplexity AI 方面否認了違反協議的指控，並強調他們的 PerplexityBot 遵守 robots.txt。他們確認 Perplexity 控制的服務沒有以任何違反 AWS 服務條款的方式進行抓取。然而，他們承認使用了第三方爬蟲軟件，這些軟件可能會忽略協議。此外，如果用戶在與 PerplexityBot 進行聊天時包含特定 URL，PerplexityBot 也會忽略 robots.txt。

Share this content:

Views: 39