"No envíes código contaminado": estos proyectos de software libre dicen 'No' al uso de asistentes de programación con IA

Hace unas semanas Gentoo Linux dio el primer paso, ahora le ha tocado el turno a NetBSD

Open Source Not Ai
5 comentarios Facebook Twitter Flipboard E-mail

Hace casi dos años, cuando comenzaba el 'boom' de la IA generativa, rápidamente empezaron a surgir iniciativas dentro de las comunidades online de artistas para prohibir en su seno la publicación de imágenes generadas mediante inteligencia artificial. Se mezclaban entonces, para respaldar esta decisión, argumentos relacionados tanto con la calidad de las imágenes como con consideraciones legales y éticas en torno a los derechos de autor.

Ahora, cuando la existencia de asistentes de IA para la generación de código de software se ha normalizado, y los desarrolladores recurren de manera habitual a herramientas como ChatGPT o GitHub Copilot, la controversia gira en torno al uso de las mismas en entornos relacionados con software de código abierto.

El debate, de hecho, ha ganado protagonismo recientemente, después de que tanto una distribución Linux (Gentoo) como otro sistema operativo libre también basado en Unix (NetBSD) hayan tomado medidas en las últimas semanas para prohibir el uso de código generado por modelos de IA.

Un vistazo a…
La carrera de programador en 2017 y en el futuro (con Javier Santana)

Las decisiones de Gentoo y NetBSD

En abril, Gentoo Linux se convirtió en el primer proyecto de sistema operativo de código abierto en implementar una política que prohíbe el uso de código generado por herramientas de IA, como el Copilot de Github. Esta semana, el proyecto NetBSD actualizó sus directrices de commits para incluir una restricción similar.

El problema de la calidad del código. Las herramientas de IA a menudo producen código de baja calidad que ningún proyecto 'open source' desearía incluir:puede contener errores sutiles y problemas de seguridad que no son inmediatamente evidentes, lo que aumenta el riesgo de vulnerabilidades. Además, se corre el riesgo de atraer contribuciones de programadores que no pueden identificar o mejorar dicho código.

Los problemas relacionados con el copyright son más complejos. Los modelos de IA funcionan generando respuestas probabilísticas a partir de enormes cantidades de texto... texto que a menudo incluye todo tipo de contenido accesible gratuitamente o a bajo costo en la WWW. Esto puede incluir código fuente de diversos proyectos, lo que plantea el riesgo de violaciones de licencias si el código generado es demasiado similar al original.

El problema de las licencias

En el caso de NetBSD, el problema se agrava debido a las diferencias de licencias. Mientras que muchos desarrolladores de Linux usan la licencia GPL, NetBSD utiliza una licencia BSD. La diferencia clave entre estas dos licencias radica en sus restricciones y requisitos.

La GPL es una licencia copyleft, lo que significa que cualquier software derivado de código bajo GPL también debe ser licenciado bajo GPL. Esto asegura que el software permanezca libre y abierto, pero también impone restricciones estrictas sobre cómo se puede reutilizar y redistribuir el código.

Por otro lado, la licencia BSD es mucho más permisiva. Permite que el código se utilice de manera más flexible, incluso en proyectos propietarios, sin el requisito de liberar el código fuente de las modificaciones. Esta diferencia fundamental significa que incorporar inadvertidamente código GPL en un proyecto BSD puede crear conflictos legales significativos.

Si se detecta código GPL en el proyecto NetBSD, las opciones disponibles no son sencillas. Una posibilidad es relicenciar el código existente bajo la GPL, pero esto va en contra de la filosofía del proyecto NetBSD; la otra opción es identificar y eliminar todo el código contaminado con GPL, lo que puede implicar la reescritura de grandes secciones del proyecto.

Además, el proceso de revisar el código para detectar violaciones de licencia es extremadamente laborioso. Por lo tanto, para NetBSD, la incorporación accidental de código generado por IA que esté basado en código GPL representa un riesgo significativo.

Imagen | Marcos Merino mediante IA

En Genbeta | Microsoft hizo algo inusual con MS-DOS por primera vez en 10 años. Y así ha reaccionado el creador del Administrador de Tareas

Inicio