Amazon Investiga a Perplexity AI por Alegaciones de Rastreo No Autorizado de Sitios Web

Home Noticias de IA Amazon Investiga a Perplexity AI por Alegaciones de Rastreo No Autorizado de Sitios Web

Amazon Web Services (AWS) ha iniciado una investigación sobre Perplexity AI para determinar si está violando las normas relacionadas con la exploración web. Según Wired, AWS está investigando alegaciones de que el servicio opera un crawler, alojado en sus servidores, que ignora el Protocolo de Exclusión de Robots (Robots Exclusion Protocol). Este estándar web permite a los desarrolladores colocar un archivo robots.txt en sus sitios, indicando qué páginas pueden ser accedidas por bots. Aunque el cumplimiento es voluntario, la mayoría de los crawlers de buena reputación han respetado estas indicaciones desde el inicio del protocolo en la década de 1990.

Wired informó previamente sobre el hallazgo de una máquina virtual que eludía su propia configuración de robots.txt, alojada en un servidor de AWS con la dirección IP 44.221.181.252, que se cree asociada a Perplexity. Se alega que este crawler ha accedido a los sitios de Condé Nast cientos de veces en los últimos tres meses, así como realizado múltiples visitas a The Guardian, Forbes y The New York Times. Para verificar potenciales scraping de contenido, Wired probó el chatbot de Perplexity con titulares y descripciones cortas de sus artículos, obteniendo respuestas que reflejaban estrechamente los artículos con mínima atribución.

En un informe relacionado, Reuters destacó que Perplexity no es la única empresa de IA que omite archivos robots.txt para recoger contenido para entrenar grandes modelos de lenguaje. Sin embargo, parece que Wired solo proporcionó a AWS información sobre el crawler de Perplexity. Un portavoz de AWS aclaró: "Nuestros términos de servicio prohíben actividades abusivas e ilegales, y nuestros clientes deben cumplir con esos términos. Recibimos informes de presunto abuso y trabajamos con nuestros clientes para abordar estos informes." El portavoz confirmó que AWS está investigando las afirmaciones presentadas por Wired.

La portavoz de Perplexity, Sara Platnick, afirmó que la empresa ha respondido a las consultas de AWS, negando que sus crawlers violen el Protocolo de Exclusión de Robots. "Nuestro PerplexityBot—que opera en AWS—respeta robots.txt, y confirmamos que los servicios controlados por Perplexity no exploran de manera que infrinja los términos de AWS," comentó Platnick. Añadió que la consulta de AWS era una práctica habitual para abordar el abuso potencial y mencionó que Perplexity no tuvo previo aviso de la investigación antes del contacto de Wired. Platnick reconoció que PerplexityBot puede ignorar robots.txt cuando los usuarios proporcionan URLs específicas en sus consultas.

Aravind Srinivas, CEO de Perplexity, también refutó las afirmaciones de que la empresa está "ignorando el Protocolo de Exclusión de Robots y mintiendo al respecto." Sin embargo, admitió, en conversación con Fast Company, que Perplexity emplea crawlers web de terceros además de los suyos, y reconoció que el bot identificado por Wired es una de estas herramientas externas.

Cloudflare Responde: Protegiendo Sitios Web de Rastreadores de IA

Por qué deberías evitar confiar en chatbots de IA como fuente de noticias

Most people like

Crumb

11.8K

Descubre nuestro generador de recetas con inteligencia artificial que crea platos únicos adaptados a los ingredientes que tienes a mano. Desata tu creatividad culinaria y transforma tu despensa en una cocina gourmet con recetas personalizadas al alcance de tu mano.

Generador de recetas de IA AI Recipe Assistant

SDXL Turbo

444.8K

Experimenta una generación de imágenes de IA ultra-rápida y de alta calidad, impulsada por avanzada tecnología ADD.

Generación de imágenes por IA AI Photo & Image Generator

Programmers Force

29.3K

En el mundo acelerado y tecnológico de hoy, las empresas de todo el mundo están recurriendo a la inteligencia artificial (IA) para mejorar la eficiencia y fomentar la innovación. Desde la automatización de tareas rutinarias hasta la provisión de información basada en datos, las soluciones de IA permiten a las organizaciones mantenerse competitivas y adaptarse a mercados en rápida transformación. Esta guía explora diversas tecnologías de IA adaptadas para empresas globales, mostrando cómo pueden transformar las operaciones, optimizar procesos y, en última instancia, contribuir al crecimiento sostenible. Descubre cómo implementar la IA puede revolucionar tu estrategia empresarial y posicionarte a la vanguardia de tu industria.

Inteligencia Artificial Other

Upscayl - Free AI Image Upscaler

603.7K

Desbloquea el poder de una herramienta de inteligencia artificial gratuita diseñada específicamente para mejorar imágenes. Ya seas fotógrafo, diseñador o simplemente alguien que busca realzar sus visuales, esta innovadora tecnología facilita la elevación de la calidad de tus imágenes sin comprometer los detalles. ¡Experimenta hoy las capacidades transformadoras del escalado de imágenes impulsado por IA!

ampliación de imágenes AI Image Enhancer

Find AI tools in YBX