Software Heritage es el mayor archivo de software de código abierto con on 3.000 millones de archivos

Software Heritage es un ambicioso proyecto que, desde Francia y a escala mundial, está tratando de archivar todo el software de código abierto del mundo. Esto va mucho más allá de guardar copias de algunas de las aplicaciones más populares, y a día de hoy el archivo cuenta con 3.000 millones de archivos pertenecientes a más de 49 millones de proyectos.

Para conseguir tal número, el profesor Roberto Di Cosmo y su equipo lleva tres años recopilando desde los proyectos anónimos que aparecen en portales como GitHub hasta las aplicaciones abiertas más populares de la red. Tal y como Di Costo le ha explicado a Teknautas, el objetivo de su iniciativa es crear una colección de todo el código disponible para que se siga pudiendo acceder a él a largo plazo.

El verdadero conocimiento está en el código fuente y no en el ejecutable, con esa máxima en mente y ante el temor de estar perdiendo este conocimiento crearon un consorcio internacional en el que voluntarios, centros de investigación y universidades se pasaron un año creando la infraestructura hasta hacer público el portal el verano pasado.

El objetivo: que cualquiera tenga acceso al repositorio

El objetivo final de este ambicioso proyecto es que cualquiera pueda tener acceso al mayor repositorio de código fuente de proyectos open source del mundo. No sólo para investigar y analizar, sino para que cualquiera pueda buscar vulnerabilidades o crear aplicaciones aún mejores basadas en las existentes.

El software domina nuestro mundo. Nos comunicamos con los nuestros gracias a él, nos ayuda a pagar las facturas, a acceder al entretenimiento y a comprar todo tipo de contenidos online. También mantiene en marcha nuestra economía y es la base de cualquier dispositivo electrónico. Por eso, en opinión de este proyecto, es importante conservarlo todo para que no se pierda.

Además de almacenar el código, la página también está creando fichas con la historia del desarrollo de cada proyecto para convertirse en algo así como la gran Wikipedia del software. De momento han empezado creando una copia de todo GitHub, y de repositorios como Debian o Google Code, así como los aportados por empresas como Microsoft Francia.

Con estos tres puntos iniciales se aseguran de tener cubierta la mayoría del software abierto que se utiliza hoy, desde las distros GNU/Linux hasta aplicaciones como Firefox o Libre Office, pasando por el código fuente del mismísimo Apolo XI.

De momento, el de Software Heritage sigue siendo un proyecto en desarrollo, y los usuarios aún no podemos acceder a él de forma masiva y descargarnos el código que almacenan, aunque la idea es que lo podamos hacer a medio y largo plazo. Aún así, si sabemos el identificador SHA de un proyecto podremos buscarlo para acceder a él. Pero antes tendrán que conseguir lo más difícil para cualquier proyecto de estas características: la financiación y apoyo suficiente para poder seguir.

Por eso, sus responsables animan a que cualquiera se una a su lista de correo y a su canal de IRC para suscribirse y colaborar. También tienen un programa de sponsors para que todas esas instituciones y empresas que quieran ayudar puedan hacerlo. El dinero se destinará a reforzar la infraestructura y financiar sus gastos derivados para seguir creciendo, ya que es un proyecto sin ánimo de lucro: sólo quieren preservar nuestra herencia de software.

Enlace | Software Heritage
Vía | Teknautas
En Genbeta | ¿Cual es la diferencia entre el Software Libre y el Open Source?

Ver todos los comentarios en https://www.genbeta.com

VER 0 Comentario

Portada de Genbeta