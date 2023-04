A mediados del año pasado Eliezer Yudkowsky publicó un artículo titulado 'La ruina de la IA general: una lista de formas en que podemos morir', que fue contestado al poco tiempo por Paul Christiano en su propio artículo 'Dónde concuerdo y discrepo de Eliezer'.

Yudkowsky es el famoso experto en inteligencia artificial que no firmó la carta abierta en la que Elon Musk y otras personalidades solicitaban una moratoria en el desarrollo de nuevas IAs avanzadas… porque se quedaba muy corta, y resumía su posición con la frase "La IA nos matará a todos".

Paul Christiano dirige hoy en día el Alignement Research Center, una institución dedica a estudiar la 'alineación' —esto es, el intento de alinear los intereses de futuras IAs autónomas con el interés general de la Humanidad— y antes de eso había dirigido el equipo de alineación de modelos de lenguaje de la propia OpenAI, los creadores de ChatGPT.

De hecho, en su etapa en dicha compañía fue el principal responsable del desarrollo de la técnica conocida como "Reinforcement Learning from Human Feedback" (RLHF), destinada a entrenar sistemas de inteligencia artificial combinando el aprendizaje por refuerzo con la retroalimentación humana, de modo que la IA 'aprende' a tomar decisiones con un sistema de castigos e incentivos juzgado por criterios humanos.

Por eso, resultaba tranquilizador que Christiano, como voz autorizada en el tema, aportase un punto de vista algo (sólo algo) más optimista que el de Yudkowsky en su artículo de junio, afirmando que éste último

"plantea muchas buenas reflexiones respaldadas por argumentos bastante claros, pero hace afirmaciones contundentes que van mucho más allá que cualquier cosa sugerida por argumentos reales".

Recordemos que, por aquel entonces, no había surgido ChatGPT ni todo el debate que ha inspirado en los últimos meses. Pero hace dos días, en el canal Bankless de YouTube le han realizado una entrevista de dos horas que sólo podemos resumir con la siguiente frase:

"¡Demonios! ¿Y éste es el optimista?"

En su entrevista, en la que hace referencia explícita a las muy comentadas teorías de Yudkowsky, afirma que "Hay muchas formas diferentes en las que todos podríamos morir a causa de las máquinas. Sobre la que más habla Eliezer es la del escenario de toma de control total por parte de una IA".

Es decir, Skynet. "Creo que tal vez hay algo así como un 10-20% de probabilidad" de que esto ocurra", dice Christiano. En ese caso, "muchos, si no la mayoría de los humanos, morimos". Pero Christiano suma a eso otro 10% de probabilidades (y ya rondamos una de cada 3, en total) de que la IA obtenga "acceso a nuevas tecnologías físicas destructivas".

Según Christiano, estamos presenciando un cambio acelerado en tecnologías de IA que ya antes de ChatGPT eran un problema potencial, y lo estamos viviendo en un contexto en el que la tecnología es muy nueva y no estamos preparados para ella. ¿Y qué significa eso?

"En general, que tal vez estemos alcanzando una probabilidad de alrededor del 50% de [que tenga lugar] un desastre poco después de que creemos sistemas de IA a nivel humano".

"Hay una probabilidad razonable de que todos muramos [por este motivo]. Creo que esta es la razón más probable por la que yo, personalmente, moriré".

Vaya.

Christiano también aclara en su entrevista que parte del problema es que no hay más de 50-200 personas en la industria de la IA actuando motivadas por el riesgo de que la IA sea capaz de tomar el control en el futuro. "Ciertamente, no es mucha gente".

Su antiguo jefe en OpenAI, Sam Altman, ciertamente no parece ser una de esas personas: aunque él mismo se ha construido un búnker ante semejante eventualidad, y a que ha afirmado que no descarta que terminemos creando una IA "que dé miedo", ha seguido desarrollando sin pausa nuevas IAs cada vez más avanzadas desde su compañía (de hecho, ha liderado y aún lidera este campo) y ha 'pasado' ampliamente de la carta de Musk pidiendo una moratoria (no ayuda su tensa relación personal con él, claro).

