AWS 近日對 Perplexity AI 進行調查,因其被指無視標記擅自抓取網站內容,引發爭議。據報導,AWS 正在調查 Perplexity AI 是否使用網絡爬蟲程式,避開 robot.txt「機械人排除協議」,從而對不希望被爬蟲抓取內容的網站進行資料收集。此前有媒體發現,Perplexity AI 多次存取被排除的網站內容,忽略了網站上的 robot.txt 協議。這些網站包括 Wired、The Guardian、Forbes 和 The New York Times 等。由於虛擬機器是在 AWS 上託管的,因此 AWS 也對此事做出回應。
Perplexity AI 方面否認了違反協議的指控,並強調他們的 PerplexityBot 遵守 robots.txt。他們確認 Perplexity 控制的服務沒有以任何違反 AWS 服務條款的方式進行抓取。然而,他們承認使用了第三方爬蟲軟件,這些軟件可能會忽略協議。此外,如果用戶在與 PerplexityBot 進行聊天時包含特定 URL,PerplexityBot 也會忽略 robots.txt。
Share this content: