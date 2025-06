La forma de entrenar a las IA es un tema que históricamente ha generado una gran polémica, sobre todo por el origen de los datos que utilizan las empresas para realizar esta tarea. La última gran controversia la ha protagonizado Reddit, que ha denunciado a la startup de IA Anthropic por haber utilizado presuntamente los datos de su comunidad sin contar con un acuerdo de licencia.

Reddit acusó en las últimas horas a Anthropic de usar de manera ilegal los datos de Reddit con fines comerciales, sin haber pagado ni un dólar y sin respetar sus políticas de privacidad. Y es que, bajo un acuerdo, Reddit no tiene inconveniente en compartir las conversaciones de sus usuarios, como ya ha hecho firmando contratos con Google o OpenAI.

Reddit no quiere que nadie vea su comunidad. A no ser que paguen

"Anthropic, de hecho, está entrenando intencionadamente con los datos personales de los usuarios de Reddit sin solicitar su consentimiento", afirmaba la compañía en la queja que ha presentado. Una acusación que a Anthropic no le ha gustado en absoluto, ya que ha respondido rechazando dichas afirmaciones y asegurando que se defenderán.

Reddit ya implementó el año pasado diversas medidas para proteger la información pública publicada en la comunidad. En este sentido, su política de contenido público protegía las publicaciones en subreddits, garantizando que los contenidos eliminados y los comentarios borrados no se incluyeran en los acuerdos de licencia de datos. Sin embargo, el resto de la información sí podía ofrecerse siempre bajo un acuerdo.

Según Reddit, dicho acuerdo estuvo a punto de cerrarse con Anthropic, pero finalmente no llegó a firmarse. Posteriormente, Reddit descubrió que Anthropic habría accedido igualmente a los datos de la comunidad, algo que no dudaron en bloquear, argumentando que "creemos en un internet abierto. Eso no significa abierto para la explotación".

Precisamente, la IA en entrenamiento requiere una enorme cantidad de datos para poder desarrollarse. En el pasado, ya hemos visto polémicas similares, entre las que destacan los entrenamientos con libros protegidos por derechos de autor, o la sonada demanda de The New York Times contra Microsoft y OpenAI por el uso del contenido de sus artículos.

