OpenAI se enfrenta a una demanda colectiva por usar nuestros datos para entrenar a ChatGPT y Dall-E sin permiso

Un bufete de abogados de California, de nombre Clarkson, ha presentado una demanda colectiva contra OpenAI por "robar" datos personales para entrenar a su inteligencia artificial ChatGPT.

La demanda alega que ChatGPT y Dall-E "utilizan información privada robada, incluida información de identificación personal, de cientos de millones de usuarios de Internet, incluidos niños de todas las edades, sin su consentimiento informado o conocimiento".

En Genbeta

Las grandes IAs se están entrenando sin consentimiento: así puedes comprobar qué webs se han usado para ello

Que ChatGPT ha usado datos de plataformas como Reddit no es un secreto. Ahora, la demanda dice que OpenAI extrajo 300.000 millones de palabras de Internet, incluida información personal y publicaciones de redes sociales como Twitter y Reddit. El bufete de abogados afirma que OpenAI "lo hizo en secreto y sin registrarse como intermediario de datos, tal y como exige la legislación aplicable".

Necesidad de un permiso

La denuncia incluye 15 cargos, como violación de la intimidad, negligencia por no proteger datos personales y hurto al obtener ilegalmente cantidades masivas de datos personales para entrenar sus modelos.

OpenAI supuestamente utilizó estos datos sin permiso ni consentimiento de los usuarios en el contexto de ChatGPT. Aunque la información personal de la gente es pública en redes sociales, blogs y artículos, si los datos se utilizan fuera de la plataforma, puede considerarse una violación de la privacidad.

En Genbeta

Hay quien ha convertido a ChatGPT en su propio prompt engineer, la profesión que promete sueldazos: esta es la orden que usa

Conjuntos de datos como Common Crawl, Wikipedia y Reddit, que incluyen información personal, están a disposición del público siempre que las empresas sigan los protocolos de compra y uso de estos datos.

Entre otros asuntos, la demanda exige transparencia, afirmando que OpenAI debe abrir la "caja negra", para revelar con claridad y precisión los datos que está recopilando, incluyendo dónde y de quién, en documentos de documentos normativos claros y visibles que expliciten cómo se almacenará, tratará, protegerá y utilizará esta información.

Polémica por la protección de datos

En Europa las herramientas de IA de OpenAI ya han vivido ciertas restricciones en sitios como Italia, amparadas, de hecho, por la legislación del Reglamento General de Protección de Datos. En Europa existe una distinción legal entre los datos de dominio público y los de libre uso gracias a la ley GDRP, pero en EE.UU. eso sigue siendo objeto de debate.

Esta demanda incluye las opacas políticas de privacidad de OpenAI para los usuarios existentes, pero se centra en gran medida en los datos extraídos de la web que nunca se pretendió explícitamente compartir con ChatGPT.

En Xataka

17 cursos y tutoriales de ChatGPT online y gratis para mejorar prompts y el uso de la inteligencia artificial

Los productos de la empresa, incluidos ChatGPT-3.5, ChatGPT-4.0 y Dall-E "utilizan información privada robada, incluida información personal
identificable, de cientos de millones de usuarios de Internet, incluidos niños de todas las edades, sin su consentimiento informado o conocimiento", explica la demanda. Además, hay "millones de consumidores desprevenidos de todo el mundo".

Vía | Mashable

Imagen | Jonathan Kemper en Unsplash

Necesidad de un permiso

Polémica por la protección de datos

RECIBE "Xatakaletter", NUESTRA NEWSLETTER SEMANAL

Explora en nuestros medios