La inteligencia artificial está aprendiendo a hacer cosas que, hasta hace unos meses, parecería que se han sacado de material de ciencia ficción. No obstante, estos usos ya están entre nosotros, y en el post de hoy te traemos una nueva herramienta de IA, que puede usar desde tu iPhone y que traduce tu voz. Sí, por muy extraño que te parezca un idioma, gracias a este algoritmo, lo vas a hablar (en vídeo) tal y como si fueras nativo.
Crea un deepfake de tu voz, pero en otro idioma
Las recreaciones de nuestra persona, en sus diferentes aspectos, ya se está manifestando de diferentes maneras en el mundo de la inteligencia artificial. Ya sea poniendo nuestra cara en otra persona o dando nuestra voz a procesadores para que podamos recrearla de forma virtual, esto no ha hecho más que empezar.
Y una de las iteraciones que ha salido recientemente a la luz es Rask.AI, una herramienta web que podemos abrir desde Safari, que tiene una premisa muy sencilla: nos grabamos en vídeo, hablando frente a la cámara; subimos el vídeo a la aplicación web y esperamos a que se procese y, finalmente, vamos a recibir el mismo vídeo, con nuestra cara y nuestra voz, pero traducida en el idioma que nosotros queramos. Eso sí, hay que tener que estamos hablando de una herramienta de nueva creación, en la que estamos usando la versión gratuita.
Ello implica que los idiomas que son más parecidos entre ellos o que son traducidos de forma más habitual, van a tener un resultado mucho más preciso, en cuanto a nuestra voz respecta. Uno de los ejemplos que hemos podido probar, que funciona bien, es la de traducir del español al inglés. No obstante, intentamos traducir del catalán al chino mandarín, y la voz no era la misma. Pero esto es IA, así que también es cuestión de poco tiempo de ver una mejora significativa en ese aspecto.
Parece difícil de creer de primeras, pero lo cierto es que es una herramienta que funciona sorprendentemente bien para ser de tan reciente creación. Por el momento, sólo funciona el apartado de traducir nuestra voz. Pero no hay una sincronización de labios. Es decir, que en versiones futuras, los desarrolladores ya han dicho que, además de la voz traducida, esta quedará sincronizada con la dicción y el movimiento de nuestros labios.
Cómo se traduce nuestra voz en Rask.AI
El funcionamiento es muy sencillo. Una vez hemos iniciado sesión, tendremos un panel en el que veremos los proyectos que tenemos traducidos. Basta con seleccionar el vídeo que queramos, ajustar los parámetros de idioma y dejar que la IA procese. ¿Y cómo lo hace? Pues transcribiendo lo que decimos en el vídeo, para después traducirlo y aplicarlo con la técnica de deepfake de voz.
Cuando el vídeo se traduce, la página web nos indica que podemos cerrar la página. Y en unos minutos, vamos a recibir un correo electrónico con el proyecto ya traducido. Pero también podremos obtener el resultado de nuestra traducción en la propia interfaz web de Rask.AI.
Rask.AI tiene un plan gratuito con el que tenemos acceso a traducir dos vídeos al mes, de como máximo, 100 mb de tamaño y un minuto de duración. No obstante, ya con el plan de pago, se desbloquea esta limitación. Y es que pasaremos a tener hasta 25 minutos de duración máxima por vídeo, en más de 60 idiomas diferentes, en el plan de 39 dólares mensuales. Pero si queremos ir más allá, podemos ir a por el plan Pro, que cuesta 99 dólares al mes y con la que tendremos derecho de acceso anticipado a la función de sincronización de labios, y 100 minutos de duración máxima en cada vídeo.