El torrent está muy vivo más allá de las descargas de películas. Ahora se está usando para distribuir inteligencia artificial

¿Miles de usuarios bajándose un modelo de IA recién lanzado con un peso de 87 GB? Eso no hay servidor web que lo soporte. BitTorrent, en cambio...

Ia
5 comentarios Facebook Twitter Flipboard E-mail

Mucha gente sigue relacionando el concepto de 'torrent' con sitios web de descargas no autorizadas de películas y otros contenidos con copyright. Sin embargo, casi desde el primer momento de la existencia del protocolo BitTorrent, éste ha venido siendo usado por proyectos de desarrollo de software para difundir el software más 'pesado'.

Por ejemplo, son numerosas las distribuciones de Linux (entre las más destacadas, Ubuntu, Fedora, Debian, Arch u OpenSUSE) que utilizan los torrents como método de distribución en cada lanzamiento de una nueva versión. Esto se debe a que las descargas por torrent permiten una distribución eficiente y escalable de archivos grandes (como es el caso de las imágenes ISO de este y otros sistemas operativos).

Y todo ello gracias a que su arquitectura descentralizada evita que se sobrecarguen los servidores web y/o FTP oficiales en los momentos de mayor demanda de los ficheros (justo después de cada lanzamiento, normalmente).

Deubuntu Captura de pantalla de la sección de 'Descargas' de la web de Ubuntu.

No está claro cuáles fueron exactamente las primeras distribuciones de Linux que adoptaron el protocolo BitTorrent, pero sí sabemos que, tras la creación de éste por Bram Cohen en 2002, fue adoptado tempranamente por varios proyectos de Linux. En ese momento, eso les permitió ahorrar miles de dólares en coste de ancho de banda, lo cual constituía un salvavidas para los proyectos comunitarios más pequeños (y, por tanto, con menos recursos).

Tan frecuente se volvió este sistema que, ya en 2005, el sitio web Linuxtracker comenzó a agregar estas distribuciones de Linux que utilizaban torrents, y desde entonces, el sitio ha crecido constantemente, convirtiéndose en una de las fuentes de referencia para obtener distribuciones de Linux.

Material multimedia como películas de dominio público o rodadas por artistas independientes, también suelen estar disponibles mediante BitTorrent
Un vistazo a…
BitTorrent: ¿qué es y cómo funcionan los torrents?

De las distros a los modelos

Ok, pero además de las distribuciones Linux y alguna que otra aplicación open source especialmente 'pesada' (que cada vez tienen menos necesidad del torrent gracias a los nuevos servicios de alojamiento en la nube)... ¿qué otro papel tiene BitTorrent en lo que respecta a la distribución de software?

Pues, desde hace unos meses, ha empezado a ser utilizado masivamente para la descarga de uno de los tipos de software más voluminosos a la par que populares del momento... los grandes modelos de IA generativa, tanto de imagen como de texto.

Así, la miríada de versiones derivadas y optimizadas basadas en modelos open source como Stable Diffusion (en creación de imágenes) y en múltiples LLMs (como LLaMa y sus múltiples derivados, o el crecientemente popular Mixtral) cuentan con BitTorrent como un recurso insustituible, dado el tamaño de varias docenas de GB que pueden llegar a alcanzar las versiones más potentes de los mismos.

Hace algo más de un mes, la startup francesa de IA open source Mistral AI lanzaba un nuevo LLM sin nota de prensa ni anuncio espectacular: se había limitado a publicar en X un enlace magnet (propio del protocolo BitTorrent), una estrategia que contrastaba claramente con un lanzamiento casi paralelo, el de Gemini, de Google.

Mistral
Tuit

Porque, ahí donde la compañía del buscador, pese a todo el ruido del lanzamiento, sólo había permitido entrever las capacidades de su nuevo modelo, Mistral AI había puesto sobre la mesa una descarga de nada menos que 87 GB, correspondiente a su modelo Mixtral 8x7B.

Como consecuencia de ese lanzamiento, ya existen por Internet numerosos derivados de Mixtral que permiten, por ejemplo, la generación de texto carente de censura.

Las principales alternativas open source a Mixtral son los derivados de la filtración de LLaMa de Meta (modelos dotados de los muy adecuados nombres de Vicuna, Alpaca o Guanaco)... y dicha filtración también tuvo lugar en un primer momento (marzo del año pasado) gracias a un enlace torrent.

En Genbeta | Las mejores aplicaciones para descargar Torrents en Windows 10 y 11 en 2023

Inicio