OpenAI se enfrenta a una demanda colectiva por usar nuestros datos para entrenar a ChatGPT y Dall-E sin permiso

Jonathan Kemper Uf3vfhv04sa Unsplash
4 comentarios Facebook Twitter Flipboard E-mail

Un bufete de abogados de California, de nombre Clarkson, ha presentado una demanda colectiva contra OpenAI por "robar" datos personales para entrenar a su inteligencia artificial ChatGPT.

La demanda alega que ChatGPT y Dall-E "utilizan información privada robada, incluida información de identificación personal, de cientos de millones de usuarios de Internet, incluidos niños de todas las edades, sin su consentimiento informado o conocimiento".

Que ChatGPT ha usado datos de plataformas como Reddit no es un secreto. Ahora, la demanda dice que OpenAI extrajo 300.000 millones de palabras de Internet, incluida información personal y publicaciones de redes sociales como Twitter y Reddit. El bufete de abogados afirma que OpenAI "lo hizo en secreto y sin registrarse como intermediario de datos, tal y como exige la legislación aplicable".

Un vistazo a…
ZAO, la APP MÓVIL china que a través de DEEPFAKE te convierte en DICAPRIO en SEGUNDOS

Necesidad de un permiso

La denuncia incluye 15 cargos, como violación de la intimidad, negligencia por no proteger datos personales y hurto al obtener ilegalmente cantidades masivas de datos personales para entrenar sus modelos.

OpenAI supuestamente utilizó estos datos sin permiso ni consentimiento de los usuarios en el contexto de ChatGPT. Aunque la información personal de la gente es pública en redes sociales, blogs y artículos, si los datos se utilizan fuera de la plataforma, puede considerarse una violación de la privacidad.

Conjuntos de datos como Common Crawl, Wikipedia y Reddit, que incluyen información personal, están a disposición del público siempre que las empresas sigan los protocolos de compra y uso de estos datos.

Entre otros asuntos, la demanda exige transparencia, afirmando que OpenAI debe abrir la "caja negra", para revelar con claridad y precisión los datos que está recopilando, incluyendo dónde y de quién, en documentos de documentos normativos claros y visibles que expliciten cómo se almacenará, tratará, protegerá y utilizará esta información.

Polémica por la protección de datos

En Europa las herramientas de IA de OpenAI ya han vivido ciertas restricciones en sitios como Italia, amparadas, de hecho, por la legislación del Reglamento General de Protección de Datos. En Europa existe una distinción legal entre los datos de dominio público y los de libre uso gracias a la ley GDRP, pero en EE.UU. eso sigue siendo objeto de debate.

Esta demanda incluye las opacas políticas de privacidad de OpenAI para los usuarios existentes, pero se centra en gran medida en los datos extraídos de la web que nunca se pretendió explícitamente compartir con ChatGPT.

Los productos de la empresa, incluidos ChatGPT-3.5, ChatGPT-4.0 y Dall-E "utilizan información privada robada, incluida información personal
identificable, de cientos de millones de usuarios de Internet, incluidos niños de todas las edades, sin su consentimiento informado o conocimiento", explica la demanda. Además, hay "millones de consumidores desprevenidos de todo el mundo".

Vía | Mashable

Imagen | Jonathan Kemper en Unsplash

Comentarios cerrados
Inicio