Microsoft muestra cómo son capaces de crear un holograma de ti mismo hablando perfectamente en otro idioma

Microsoft es una de las compañías más interesadas en el desarrollo de la realidad aumentada, en la que llevan trabajando desde hace años, entre otras herramientas, con HoloLens. Ayer, en una conferencia en Las Vegas, Microsoft demostró cómo se podía traducir texto y combinarlo con la propia voz del interlocutor de la grabación principal de dicho texto, para acabar creando una recreación de la grabación original en cualquier otro idioma.

El resultado es un holograma capaz de mostrarnos hablando en un idioma que desconocemos, ya que "tan solo" es necesaria dicha grabación para realizar todo el proceso que le sigue. Todo ello, a través de un trabajo conjunto de HoloLens y su nube, Azure. El resultado es bastante llamativo, y nos muestra un futuro en el que la tecnología puede ayudarnos a salvar las barreras del idioma.

Hablando en cualquier idioma sin conocerlo

Julia White, una de las directivas de la compañía, ha tenido a bien mostrar ante el mundo las bondades de su tecnología llamada 'neural text to speech'. Antes de realizar la prueba, hizo unas grabaciones en estudio, que sirvieron como base para realizar todo el proceso.

La grabación original se procesa en Azure, se traduce, y se genera otra grabación con dicha traducción, imitando el tono y voz original de la primera grabación

Estas grabaciones fueron tratadas por la inteligencia artificial de Microsoft en Azure, con el objetivo de, por un lado, traducir dichas grabaciones y, por otro lado, hacer que la traducción casara con la propia voz de la grabación original. ¿El resultado? Puedes comprobarlo tú mismo en el breve vídeo de presentación de esta tecnología.

El vídeo nos muestra cómo Microsoft es capaz de crear un holograma que "habla por nosotros" en cualquier idioma, en este caso, en perfecto japonés. Más allá de lo llamativo que resulte el propio holograma, llama la atención que la fluidez del habla es prácticamente absoluta, haciéndonos olvidar de que se trata de una traducción hecha por una IA.

Esto se debe a que, como te adelantamos, lo que pretende Microsoft es crear una traducción que respete el tono y forma de hablar de la grabación original, haciendo que el lenguaje se presente de esta forma tan natural.

El futuro de las traducciones puede pasar por la IA

Hace unos meses te hablábamos de Translatotron, el nuevo modelo integral de traducción voz a voz de Google. Mediante el mismo, eran capaces de imitar acentos y pronunciaciones, haciendo que el lenguaje resultante fuera natural.

Del mismo modo, en el Google I/O 2019, adelantaron que Google Assistant será capaz de traducir textos a tiempo real con tan solo apuntar con nuestra cámara, algo que ya se puede hacer, aunque de una forma algo más parca, con la propia aplicación del traductor de Google. Tampoco podemos perder de vista los Earbuds de Google, capaces de traducir lo que alguien nos esté diciendo a través del asistente de Google.

Con Google y Microsoft poniendo las cartas sobre la mesa de las traducciones, parece quedar claro que cada vez queda menos para que las lenguas dejen de ser una barrera a la hora de comunicarnos.

Vía | Futurism

Ver todos los comentarios en https://www.genbeta.com

VER 4 Comentarios

Portada de Genbeta