Comparte
Abr 07/2022

Esta inteligencia artificial puede predecir un rostro con solo escuchar la voz

La IA (inteligencia artificial) avanza a pasos impactantes que hacen que escenarios como Blade Runner o alguno de Black Mirror no se sientan tan alejados. El día de hoy te compartimos un avance que permite recrear o predecir un rostro únicamente analizando la voz de una persona.

Así es, como si se tratara de un retrato hablado, esta tecnología permite que el sonido de una voz sea suficiente para generar un rostro y aunque la recreación no es tan exacta, los resultados sí son bastante cercanos y sorprendentes.

Mira: Así fue r/place, el mural colaborativo creado con pixeles en Reddit

Speech2Face, la IA que puede predecir un rostro solo analizando una voz

Esta creación fue desarrollada por personas del laboratorio de informática y de inteligencia artificial del MIT (SCAIL por sus siglas en inglés) y lo iniciaron desde 2019.

Tal como lo mencionamos más arriba, Speech2Face es una IA que puede crear un rostro virtual basándose en un audio con una voz. Y es que este algoritmo puede “leer” ciertos elementos de la grabación como pueden ser la raza, edad o género.

De hecho, en el artículo sobre esta IA, los investigadores explican que el objetivo de esta herramienta NO es recrear una imagen precisa de una persona. Lo que querían es “recuperar los rasgos físicos característicos” que se correlacionan con la voz.

Los audios apenas duran un par de segundos, pero son suficientes para que la IA pueda predecir un rostro. La siguiente imagen muestra los resultados de la herramienta. Al inicio verás los rostros originales (algunos de celebridades) y al final la recreación de Speech2Face.

Foto: Speech2Face

También lee: Esta pantalla que puedes lamer te dejará probar lo que se te antojó en la tele

Para conseguir este desarrollo, entrenaron la IA con varios videos educativos de YouTube. Con eso están conscientes de que no representan por igual a la población mundial y que por eso este algoritmo no está completo. Además, se descubrió que los resultados mejoran cuando se usan audios más largos.

Quienes crearon esta IA entienden que una herramienta como esta puede crear preocupación sobre su uso y cómo podría afectar a la privacidad de las personas. Explican que este algoritmo fue usado solo con fines científicos, aunque igual aseguran que “no puede recrear la verdadera identidad de una persona por su voz”, pues capta elementos que son comunes en muchas personas.