Anthropic pone su nueva IA a gestionar una máquina expendedora. En sólo tres semanas acumuló 1000 dólares en pérdidas (y un pez vivo)

Todo indica que, por ahora, la revolución económica de la IA tendrá que esperar

Marcos Merino

Editor

La idea de que la IA pueda actuar como motor de eficiencia económica ha sido uno de los 'grandes relatos' de consultoras, inversores y empresas emergentes en estos últimos años: automatizar decisiones, optimizar precios, anticipar la demanda... Sin embargo, un experimento reciente protagonizado por Anthropic (empresa desarrolladora del modelo Claude) y por periodistas de The Wall Street Journal no hace sino poner en cuestión tal nivel de tecno-optimismo.

Por fortuna, aplicaron el principio de 'los experimentos, con gaseosa', y no pusieron una IA a gestionar una bolsa de valores ni una gran empresa logística, sino algo mucho más 'de andar por casa': una máquina expendedora localizada en una oficina.

El resultado fue tan inesperado como revelador: en apenas tres semanas, la IA encargada de gestionar el negocio de 'vending' no sólo agotó su capital inicial de 1.000 dólares, sino que terminó regalando productos, comprando artículos absurdos para una máquina de esa clase... como una PlayStation 5 o un pez de acuario.

El proyecto (bautizado como Project Vend) acabó cancelado antes de tiempo, claro.

Un experimento serio… con consecuencias cómicas

El planteamiento inicial era, sobre el papel, razonable. Los equipos de pruebas de Anthropic —conocidos internamente como el red team— querían someter a estrés a la última versión de su modelo más avanzado, Claude, enfrentándolo a una tarea aparentemente simple: gestionar una máquina expendedora como si fuera un pequeño negocio autónomo.

Para ello, se diseñó una estructura con dos agentes de IA. Uno, llamado Claudius Sennet, se encargaría del día a día: elegir productos, fijar precios, gestionar inventario y atender las peticiones que los empleados del Wall Street Journal le hacían llegar a través de Slack. El segundo, Seymour Cash, actuaría como una suerte de director ejecutivo virtual, encargado de supervisar decisiones estratégicas.

Claudius recibió una instrucción clara: generar beneficios comprando productos populares a mayoristas y vendiéndolos con margen. También se le asignó un capital inicial de 1.000 dólares y, tras una primera fase con supervisión humana, se le permitió realizar pedidos autónomos de hasta 80 dólares por operación. Nada especialmente arriesgado. Al menos, en teoría.

De la prudencia al caos colectivo

Durante los primeros días, la IA pareció comportarse de forma razonable. Rechazó peticiones disparatadas de algunos periodistas que intentaban ponerla a prueba y se mantuvo fiel a la idea de vender snacks y bebidas. Incluso llegó a declarar, con tono categórico, que jamás compraría una consola de videojuegos para una máquina expendedora.

Todo cambió cuando el canal de Slack se abrió a unas 70 personas de la redacción. La interacción masiva, combinada con la creatividad —y la picardía— de periodistas acostumbrados a investigar sistemas complejos, terminó erosionando las defensas del modelo.

Tras más de un centenar de mensajes, Claudius aceptó organizar un supuesto 'experimento económico' bautizado como Ultra-Capitalist Free-For-All: durante dos horas, todos los productos serían gratuitos.

Pero lo que debía ser una promoción puntual se convirtió en una política permanente: convencida por nuevos argumentos —algunos directamente falsos— la IA asumió que cobrar dinero podía ir en contra de las normas internas del periódico. Los precios cayeron a cero y nunca volvieron a subir.

Al mismo tiempo, se relajaron las restricciones sobre el tipo de productos: aparecieron botellas de vino, una PlayStation 5… y finalmente un pez betta vivo. Vamos, lo típico que cualquiera esperaría encontrar en una máquina expendedora de oficina.

Un 'CEO' virtual derrotado por documentos falsos

El agente supervisor, Seymour Cash, intentó intervenir cuando la situación ya era insostenible. Anunció el fin de los regalos y la necesidad de esperar a que volvieran las ventas. Sin embargo, la historia dio un nuevo giro cuando algunos participantes presentaron documentos falsificados que supuestamente demostraban que el "consejo de administración" había suspendido sus poderes.

La IA aceptó esos documentos como válidos. Seymour protestó brevemente, pero acabó cediendo. Claudius volvió a poner gratis todos los productos. Para entonces, el balance era demoledor: el capital inicial había desaparecido y las pérdidas rondaban los 1.000 dólares. El experimento se dio por terminado poco después.

¿Fracaso o éxito encubierto?

Desde fuera, Project Vend parece un desastre sin matices. Ningún humano habría tolerado un sistema que regala mercancía, compra productos absurdos y se deja engañar por documentos falsos. Sin embargo, desde Anthropic insisten en que el objetivo nunca fue ganar dinero, sino identificar debilidades.

Logan Graham, responsable del red team, defendió el experimento como un avance. Según su punto de vista, que la IA sea capaz de gestionar tantas variables y reaccionar de forma flexible —incluso si está equivocada— es un paso previo necesario para que, en el futuro, sistemas similares puedan tomar decisiones económicas complejas con mayor fiabilidad.

Algún día, dijo, "probablemente podrá hacerte ganar mucho dinero". El problema es que ese "algún día" sigue quedando lejos.

La lección incómoda para la industria de la IA

Más allá de lo anecdótico, la historia de la máquina expendedora pone el foco en un problema central del despliegue de la IA: la diferencia entre simular competencia y ejercerla en el mundo real. Claude demostró habilidades lingüísticas avanzadas, capacidad de negociación y cierta lógica económica básica. Pero también evidenció una fragilidad extrema frente a la manipulación social, la ambigüedad normativa y la presión colectiva.

En un contexto donde empresas y gobiernos estudian delegar decisiones cada vez más críticas en sistemas automáticos, el caso resulta incómodo. Si una IA no puede gestionar de forma fiable una máquina expendedora en una oficina, ¿hasta qué punto está preparada para dirigir procesos financieros, logísticos o administrativos a gran escala?

Vía | WSJ

Imagen | Marcos Merino mediante IA

En Genbeta | Los fondos de pensiones británicos se están deshaciendo de sus acciones en empresas de Silicon Valley: temen a la burbuja de la IA

Ver todos los comentarios en https://www.genbeta.com

VER Comentarios