VASA-1 la nueva IA de Microsoft



Microsoft ha presentado una inteligencia artificial capaz de generar avatares hiperrealistas a partir de una imagen y un archivo de voz. VASA-1 puede darle vida a tus fotografías añadiendo expresiones, al tiempo que sincroniza el movimiento de tus labios con el clip de sonido. El resultado final es sorprendente y podría revolucionar la forma como interactuamos en el mundo digital.

De acuerdo con los investigadores, VESA-1 captura toda la gama de expresiones humanas, incluidos los movimientos naturales de la cabeza, para generar avatares parlantes verdaderamente creíbles. Esto es posible al separar elementos como los rasgos faciales, la posición de la cabeza y las expresiones, lo que permite un control detallado de cada atributo y la posibilidad de editar el contenido here por separado.

VESA-1 va más allá de otros modelos de inteligencia artificial que añaden audio more info a una imagen y sincronizan el movimiento de labios. Los investigadores han creado get more info expresiones realistas con movimientos en un espacio definido. Esto produce una imagen más auténtica y menos rígida.

"Consideramos todas get more info las dinámicas faciales posibles, incluido el movimiento de los labios, la expresión (sin labios), la mirada y el parpadeo, entre otras, como una única variable latente y modelamos su distribución probabilística de manera unificada", mencionan los autores de Microsoft Research. "Nuestro modelado holístico de la dinámica facial, junto con los patrones de movimiento de la cabeza aprendidos conjuntamente, conduce a la generación check here de una amplia gama de comportamientos de conversación emotivos y realistas".

Leave a Reply

Your email address will not be published. Required fields are marked *