Ayer fue uno de los grandes días de la historia de la IA: estos son los grandes avances que nos han roto los esquemas

Sora, Gemini 1.5 o Slack con IA son algunos de los anuncios de este día

Arseny Togulev Meckpokjyjm Unsplash
1 comentario Facebook Twitter Flipboard E-mail

Todos nosotros estamos siendo espectadores de la carrera que están teniendo las grandes tecnológicas de todo el planeta. ¿La línea de meta? Tener la mejor IA de consumo para ofrecernos a todos nosotros. Una revolución tecnológica por la que están compitiendo muchas compañías, destacando sobre todo OpenAI y Google.

Este jueves, 15 de febrero, fue uno de esos días que pasarán a la historia en el mundo tecnológico debido a la gran cantidad de anuncios (y todos muy importantes) que vimos en referencia a la IA. Y la realidad es que cada vez las compañías nos sorprenden más y son más rápidas. Porque de un anuncio esporádico cada mes, hemos pasado a tener anuncios prácticamente cada semana o cada día.

Sora ha llegado para hacernos dudar de todos los vídeos que veamos

Uno de los grandes anuncios que hemos visto esta semana proviene de OpenAI, y es el lanzamiento de Sora. Un avance tecnológico increíble que da un paso más en el campo de la inteligencia artificial. Hasta ahora lo máximo que podíamos hacer con bastante calidad era generar imágenes a partir de una frase, como hemos hecho  para crear pósteres basados en Disney Pixar o cualquier otro tipo de creación. Pero ahora este mismo concepto pasa a ser en formato vídeo.

El año pasado veíamos algunos intentos por tener una generación de vídeos de calidad a partir de una frase, pero cojeaba bastante en lo que se refiere a calidad. Pero Sora ha significado un salto cualitativo de calidad que permite tener escenas ultra realistas a partir de prompts extensos que dan pie de tener todo lo que queramos al alcance de nuestra mano.

Más allá de tener una imagen de un paisaje en movimiento, Sora permite detallar incluso los movimientos que están realizando los personajes en todo el vídeo y la ambientación de las escenas. Todo con una duración máxima de un minuto. Y siempre resolviendo el gran problema que tenía esta IA que era la coherencia de los fotogramas o incluso las transiciones entre dos escenas diferentes.

Tras ver las diferentes pruebas que están realizando los desarrolladores (ya que todavía no está abierta a todo el público), también se plantea un gran problema: que son demasiados reales. Y es que estamos llegando a un punto de evolución en el que es complicado diferenciar de un vídeo real de uno tomado con inteligencia artificial, como ya ocurría con la generación de imágenes.

Esto abre la puerta a que podamos tener numerosos 'fakes' en redes sociales que nos planteen una situación con personajes famosos que no sean reales. De esta manera, la regulación y los límites que se establecen puede ser un punto realmente importante para que, como ocurre en la generación de imágenes con DALL-E 3 no se puedan usar diferentes términos.

Gemini 1.5 trata de reforzar la IA conversacional de Google

Este mismo jueves, y horas antes del lanzamiento de Sora, Google lanzó su nueva revolución en inteligencia artificial que es Gemini 1.5. Una versión que llegó de manera acelerada porque literalmente días antes se abrió a su uso público la versión Ultra 1.0 de Gemini. Y todo corresponde a un punto de superar a la competencia al sacar su gran fuerza para tener un mejor resultado que GPT 4.5 Turbo.

Su atractivo se basa en el aumento de tokens a la hora de procesar los prompts que se introducen con el objetivo de tener respuestas más rápidas. Entre los ejemplos expuestos se puede ver el resumen de la transcripción de 402 páginas de la misión Apollo 11 en pocos minutos, o la búsqueda de información precisa en un minuto de un vídeo de 44 minutos.

Una tecnología que a priori tuvo protagonismo durante unas pocas horas hasta que llegó Sora, al quedar en ese momento totalmente ensombrecida por el gran avance hecho por OpenAI. Es aquí donde justamente se puede ver la auténtica carrera que hay entre ambas empresas y donde el gran beneficiado somos nosotros como consumidores.

Slack suma nuevas funciones de IA generativa

Lo importante siempre es que la IA termine llegando a nuestras manos, y esto lo hemos visto también en este 'día de la AI' con Slack. Esta es una herramienta usada principalmente en ámbitos laborales para poder comunicarse entre compañeros y gestionar todas las tareas. Para poder facilitar las tareas, sus desarrolladores han agregado funciones de IA generativa.

Slack Ai

Entre estas características destaca una búsqueda mejorada con IA, el resumen de un canal o de un hilo. Esto es ideal cuando se tienen muchos mensajes acumulados y no quieres "perder" tiempo en leerlo todos. De esta manera, la IA va a ser la encargada de leerlos por ti y hacerte un resumen de aquello que no deberías perderte.

Meta y X también se suman al 'Día de la IA'

Meta aprovechó también este jueves para lanzar su nuevo modelo de inteligencia artificial llamado 'V-JEPA'. Una herramienta que está pensada para que se comprenda y prediga todo lo que sucede en un vídeo aunque se tenga información muy limitada. Esta información limitada puede ser las partes que faltan en la creación y que crean un auténtico vacío.

Esto es algo realmente complicado, ya que va a tener que comprender primero el contexto del vídeo para posteriormente generar las partes que faltan y construir lo que sería el vídeo completo. Algo que ahora mismo está limitado a los desarrolladores, pero que puede tener importantes aplicaciones.

META

X tampoco se ha querido quedar atrás con el inicio de la expansión de su propia IA en la plataforma, y concretamente en la herramienta 'Explorar'. El objetivo final de esto es tener más contexto de todos los temas que se están hablando con mayor frecuencia en X en ese mismo momento. 

Una semana donde Stable Diffusion también ha sido protagonista

Pese a que no fue este jueves, Stable Diffusion también ha tenido protagonismo en esta misma semana con el lanzamiento de una nueva herramienta que permite pasar de una frase escrita a una voz que la dicta. Pero no se quedaron aquí, ya que es algo que hemos visto en otras IA, sino que han querido nutrirla de nuevas funciones muy interesantes.

Entre ellas se destaca la posibilidad de personalizar el tono, ritmo, estilo, calidad y mucho más. Todo simplemente introduciendo en el prompt lo que estaría haciendo esa persona que está leyendo el texto que has introducido. Algo que trata de darle un poco más de humanidad a las creaciones de la inteligencia artificial.

En definitiva, una semana que ha estado cargada de avances. Y que poco a poco nos vamos a tener que acostumbrar a que semana tras semanas veamos mejoras significativas para poder destacar y captar toda nuestra atención.

Portada | Arseny Togulev

En Genbeta | Seis webs donde ya puedes dibujar con inteligencia artificial y convertirte en todo un artista

Inicio