Avalancha de nuevas herramientas de IA en Google: desde herramientas para crear vídeos hasta la lectura de grabaciones de audio

Google Workspace, la suite corporativa online de la compañía, receptora de todas estas novedades

Next24
Sin comentarios Facebook Twitter Flipboard E-mail

En el evento Cloud Next 24 que Google está celebrando hoy, la compañía ha desvelado toda una serie de innovaciones impulsadas por inteligencia artificial con las que prometen transformar el entorno laboral digital (por ahora, hay poco pensado para usuarios finales, aunque eso puede cambiar tras el evento  Google I/O de mayo).

A continuación, desglosamos los anuncios más significativos, destacando cómo cada uno se integra y potencia el ecosistema de Google Workspace:

Gemini 1.5 Pro: el 'ChatGPT de Google' sigue mejorando

El rival 'made in Google' de ChatGPT se actualizará profundizando en la multimodalidad. Ahora será capaz de procesar texto, imágenes, video, y audio, ofreciendo una capacidad de comprensión y generación de contexto significativamente mayor... y ofreciéndonos resúmenes de vídeos y de llamadas de voz sin necesidad de recurrir a transcripciones previas.

Imagen 2: mejor ser noticia por incorporar nuevas funciones

Imagen 2 es una familia de modelos de IA generativa que genera... imágenes, sí, pero no sólo eso: tras haber sido noticia por la polémica sobre las imágenes 'inclusivas' históricamente inexactas, ahora esta IA se relanza incorporando la creación de clips de vídeo (de 4 segundos) a partir de prompts de texto, una funcionalidad que amplía significativamente sus posibilidades creativas.

'Tomar notas por mí' y 'Traduce por mí' son dos funciones para detectar y traducir de forma automática los subtítulos en Meet. Tendrán soporte para 69 idiomas

Además, podremos aplicar outpainting (añadir contenido mediante IA) e inpainting (corregirlo o eliminarlo) a las imágenes creadas mediante Imagen 2. Como aspecto negativo, cabe señalar la resolución del contenido generado, aún baja, si bien Google ya ha prometido mejoras en ese frente.

Google Vids: crear vídeos como el que crea presentaciones

Vids

Google Vids es otra de las novedades destacadas de la compañía: un editor de vídeo para entornos empresariales que se incorpora al catálogo de Google Workspace como una alternativa a Powerpoint. Aparna Pappu, vicepresidenta de Google Workspace lo describe como una herramienta para optimizar la creación de presentaciones en vídeo, marcando el inicio de una era de colaboración en tiempo real en vídeo.

Google Gemini nos podrá ayudar a crear mediante IA el primer borrador del vídeo sobre el que podremos seguir trabajando después por nuestra cuenta, generando guiones, seleccionando estilos, y componiendo borradores con escenas sugeridas. Casi como si estuviéramos usando un procesador de textos en lugar de una herramienta multimedia

La nueva versión del LLM de Google se actualiza con la opción de escuchar ficheros de audio que subas a la plataforma. Eso hace posible que Gemini te haga resúmenes de llamadas de voz o de vídeos sin necesidad de recurrir a una transcripción previa. Gemini 1.5 Pro ya se anunció en febrero, pero ahora la pone a disposición del público vía su plataforma para desarrollo de aplicaciones de IA, Vertex AI.

Google ofrece también una alternativa a GitHub Copilot

La familia de modelos de IA 'Gemma' se expande con dos nuevos modelos diseñados para desarrolladores e investigadores: CodeGemma, orientado a la completación y generación de código (rival, pues, de GitHub Copilot), así como al seguimiento de instrucciones; y RecurrentGemma, una arquitectura optimizada para la experimentación en investigación.

CodeGemma ofrece capacidades de codificación potentes pero ligeras, disponibles en variantes preentrenadas de 7B especializadas en generación de código, y una variante de 2B para completación rápida de código. Sus ventajas incluyen el dominio de múltiples lenguajes y la integración en entornos de desarrollo para optimizar flujos de trabajo.

Imagen | Google + Marcos Merino mediante IA

En Genbeta | Los chatbots se están quedando anticuados: donde ellos sólo proponen, estas nuevas IA son capaces de actuar por su cuenta

Inicio