VLOGGER: IA que crea videos de cualquier persona con una foto …

La Vanguardia(E.G.Marcos)/marcianosz.com — Google vuelve a posicionarse en el mundo de la Inteligencia Artificial con un algoritmo que promete revolucionar la forma en que concebimos los videos y la interacción digital. Se trata de VLOGGER, un modelo de IA que surge de un meticuloso trabajo de investigación y tiene el potencial de cambiar drásticamente tanto el entretenimiento como la comunicación personal. Pero, ¿qué hace exactamente VLOGGER y por qué genera tanto interés?
Recientemente se ha presentado VLOGGER, una IA que viene a cambiar el paradigma de la animación de fotografías a través de la IA. Promete un sinfín de funcionalidades gracias a su sencillez, ya que es capaz de animar una fotografía y hacer que hable y gesticule como si fuera la persona de la vida real. Esto, que suena profundamente futurista ha generado también algunas reticencias sobre la aplicación que podría tener.
El equipo detrás de VLOGGER, integrado por seis destacados investigadores de la gran G, presentó un algoritmo capaz de transformar una fotografía estática en un video dinámico y realista de una persona hablando. La esencia de este avance radica en su simplicidad: para generar este video, el usuario solo necesita suministrar una imagen de la persona y el texto que desea que esta “narre”. El resultado, aunque imperfecto, posee una calidad sorprendente. Capaz de engañar a quien no preste suficiente atención, especialmente en plataformas de redes sociales.
El funcionamiento de VLOGGER se centra en la creación de “talking heads” o cabezas parlantes, en donde se mantienen constantes los ángulos de la cámara y la pose del sujeto. Mientras tanto, la inteligencia artificial se encarga de animar las expresiones faciales, movimientos de cabeza y manos con cierta fluidez natural. Lo que distingue a VLOGGER de otras tecnologías similares no es solo su capacidad de generar estos videos a partir de una simple foto. Sino la base de datos en la que se entrenó: el proyecto MENTOR, una compilación de 800 mil videos de personas hablando, todos recopilados por Google.
Un equipo de investigadores de Google dirigido por Enric Corona ha logrado un gran salto en el campo de la inteligencia artificial con el desarrollo de VLOGGER, un sistema de IA capaz de crear videos realistas de personas hablando utilizando como prompt únicamente una foto. Si bien es cierto que es un avance bastante importante e interesante dentro de la industria de la IA, también está claro que los resultados todavía se encuentran en el conocido como valle de lo inquietante. Os animo a ver el vídeo unos segundos, seguro que notaréis algo raro dentro de vosotros, como una señal de vuestro cerebro de que en esas imágenes algo no va bien. Ese es el efecto que se denomina de esta manera.
La aplicación práctica de esta tecnología promete un espectro amplio y diverso. Desde la posibilidad de animar avatares fotorrealistas para conversaciones de texto hasta la creación de noticiarios o asistentes personales digitales. Ciertamente, el alcance de este algoritmo parece ilimitado. Sectores como el entretenimiento, la creación de contenido y los videojuegos, ansiosos por nuevas formas de síntesis humana, podrían beneficiarse enormemente de esta tecnología.
– Tecnología ambivalente.
Los investigadores también vislumbran aplicaciones potenciales en el ámbito de la educación y la consulta médica virtual. Imagina, por ejemplo, un sistema de salud en línea animado por IA, que podría generar la imagen de un médico para realizar consultas online. Esta capacidad de personalizar y humanizar las interacciones digitales podría transformar significativamente la experiencia de usuario en múltiples plataformas y servicios.
El potencial de VLOGGER es bastante ammplio, ya que puede servir para generar doblaje en tiempo real con la voz del propio actor, pero también puede servir para mejorar de manera notable la accesibilidad de contenidos para personas con discapacidades. Sin embargo, no se puede ignorar la dualidad de su aplicación, ya que igualmente posee el poder de ser usado para crear deepfakes o propagar desinformación. Por este motivo, se pone sobre la mesa tanto lo bueno, como lo malo, y es que ya hay estafas con deepfakes que salen muy caro
VLOGGER trabaja a partir de una sola fotografía y un clip de audio, logrando generar videos donde el sujeto no solo habla sino también manifiesta expresiones faciales y hace gestos coherentes con lo que se está diciendo en el vídeo, mostrando que la capacidad de inferencia de la IA es elevada. Aunque los videos resultantes son fotorrealistas, aún presentan imperfecciones que permiten identificar su origen artificial. Además, es bastante notable que este avance no haya requerido de entrenamiento individualizado para cada persona. Gracias a su bloque de aprendizaje, VLOGGER ha podido aprender a adaptarse a cada persona sin ningún tipo de adaptación previa, lo que muestra un verdadero avance.
Eso sí, el vídeo como tal puede causar bastante malestar y las redes sociales ya han vertido sus primeras críticas al respecto. Ya existen apps para crear deepfakes, pero esto lo lleva a un nuevo nivel.
De forma inherente, todas aquellas innovaciones relacionadas con la inteligencia artificial suelen acarrear un conjunto de dilemas éticos y desafíos de seguridad. Aunque VLOGGER promete una herramienta potencialmente revolucionaria, también plantea preocupaciones significativas relacionadas con la creación de videos falsos. La posibilidad de generar contenido realista de cualquier persona hablando, incluso replicando su voz, abre la puerta a usos malintencionados, desde desinformación hasta manipulación mediática.
Consciente de estos riesgos, la tecnología de VLOGGER se mantiene cerrada al público. La importancia de establecer salvaguardas robustas y medidas de verificación antes de su implementación generalizada resulta vital para evitar consecuencias perjudiciales. Pese a que la publicación no detalla medidas específicas contra usos indebidos, la comunicad tecnológica debe dimensionar las implicaciones negativas.
Deja un comentario