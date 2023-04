Ayer, Stability AI —la compañía desarrolladora del modelo de inteligencia artificial de generación de imágenes Stable Diffusion— anunció el lanzamiento de la versión alfa de una nueva IA: StableLM. En este caso, como su nombre indica, se trata de un 'modelo de lenguaje'. Es decir, acaban de lanzar su propio GPT… y es open source.

En su comunicado, la empresa deja claro que la licencia de estos modelos es la Creative Commons BY-SA-4.0, por lo que "los desarrolladores pueden inspeccionar, utilizar y adaptarlos libremente con fines tanto comerciales como de investigación".

"La versión alfa está disponible en [versiones de] 3.000 millones y 7.000 millones de parámetros, a las que seguirán modelos de 15.000 a 65.000 millones de parámetros".

Esto está aún lejos del billón de parámetros de GPT-4 o los 175.000 millones de GPT-3, pero en Stability AI están convencidos de que no todo el rendimiento depende del tamaño (parámetros), sino también de la optimización de los contenidos con que se entrena al modelo:

"StableLM se entrena en un nuevo conjunto de datos experimental basado en The Pile [un famoso dataset usado por otros modelos open source], pero tres veces mayor. Daremos más detalles sobre este conjunto de datos a su debido tiempo. La riqueza de este conjunto de datos proporciona a StableLM un rendimiento sorprendentemente alto en tareas de conversación y codificación, a pesar de su pequeño tamaño".

El mencionado dataset 'The Pile' fue, de hecho, la base sobre la que la entidad sin ánimo de lucro EleutherAI (en la que Stability AI colabora) desarrolló previamente modelos lingüísticos más humildes, como GPT-J, GPT-NeoX y la suite Pythia.

In english, very good… pero en español…

El anuncio viene acompañado de una captura de pantalla de StableLM en acción, haciendo uso de una interfaz similar a ChatGPT, que lo muestra escribiendo con éxito y solvencia e-mails, simulando batallas de rap y codificando en lenguaje C el sentido de la vida (así como suena):

Sin embargo, todo eso es en inglés… y los usuarios hispanohablantes que han tenido la oportunidad de usarlo (tú también puedes hacerlo, en su web de demostración oficial o en HuggingFace) cuentan historias muy diferentes que demuestran que, al menos en lo que a nuestro idioma se refiere, aún faltan muchas cosas por afinar en este modelo de IA:

(vía @MalTrino en Twitter)

(vía @ArtToArt97 en Twitter)

"No puede ser", nos dijimos. "Eso es demasiado raro". Así que —después de intentarlo durante un buen rato, porque no le daba la gana de funcionar— lo hemos probado nosotros mismos. Y no, era mucho más raro, en realidad:

No es que importe mucho después de leer el resto… pero los enlaces no existen.

¿Un lanzamiento fallido?

Quizá, después de ver las capturas de pantalla previas, penséis que esto que ha lanzado Stability AI es alguna clase de chapuza. No, no lo es. El modelo de desarrollo open source es muy distinto del expresamente cerrado y secreto promovido por OpenAI (¿a qué esperarán para cambiarse el nombre?) para su GPT: esta versión alpha no es, como su nombre indica, un producto final, sino que dependerá de las empresas e instituciones que apuesten por este modelo su afinamiento y personalización.

En realidad, los ingenieros de OpenAI tuvieron que experimentar momentos 'WTF' muy similares antes de que decidieran hacer público ChatGPT, ya como producto final. De hecho, cualquiera que haya presenciado la evolución desde la primera versión de Stable Diffusion de hace unos meses y el actual rendimiento de los modelos derivados de aquella sabe que podemos esperar un ritmo de mejora brutal en unos pocos meses: el trabajo duro ya está hecho, aunque apenas se note.

Vía | StabilityAI

