¿Alguna vez has querido un gemelo digital? ¿O temiste tener que volver a grabar una serie de videos? Como una historia de ciencia ficción, el desarrollador de generación de medios sintéticos con sede en Londres Síntesis ha lanzado un servicio que ofrece a los clientes la posibilidad de crear representaciones de vídeo digitales de sí mismos que pueden utilizar en las redes sociales y en campañas de marketing.
Synthesia anunció por primera vez el lanzamiento de sus avatares personales durante una transmisión en vivo el miércoles. Estos avatares, según afirma Synthesia, se pueden generar utilizando tan solo dos minutos de video desde una cámara web o un teléfono móvil, aunque descubrí que crearlos lleva mucho más tiempo.
La empresa afirma que sus avatares de IA personales podrían utilizarse para generar vídeos de formación para empleados, explicaciones de productos, materiales de marketing y ventas, o para interactuar con los clientes. El beneficio para las empresas es que estos distintos vídeos pueden crearse utilizando el mismo avatar de IA sin tener que volver a grabar al actor o al empleado en una nueva sesión presencial.
Sin embargo, existen limitaciones que explicaré más adelante.
Prevención del uso indebido
Synesthesia reconoce que la capacidad de crear réplicas de alta fidelidad de personas reales podría ser utilizada de forma abusiva con fines maliciosos o engañosos. Synthesia dijo Descifrar Evita que su tecnología se utilice para crear deepfakes generados por IA siguiendo tres principios: consentimiento, control y colaboración.
“Nunca crearemos un avatar de IA sin el consentimiento explícito de alguien”, afirmó Alexandru Voica, director de asuntos corporativos y políticas de Synthesia. “Nuestra plataforma ofrece un entorno seguro para los usuarios, garantizando que sus datos estén protegidos, que tengan el control de sus avatares y que el uso indebido se minimice mediante la moderación del contenido en el momento de la creación”.
Siguiendo el punto de Voica, antes de que comience la generación del avatar, se le pide al usuario su consentimiento para la recopilación, uso, almacenamiento y divulgación de sus grabaciones de video y audio por parte de Synthesia Limited y sus proveedores “para autenticar el envío del avatar personal”.
Voica dijo que Synthesia también trabaja con pares de la industria, formuladores de políticas y otros para desarrollar las mejores prácticas para el uso responsable de la IA.
“Las falsificaciones profundas no consensuadas son la mayor fuente de contenido dañino en línea”, dijo Voica. “Dado que los avatares de Synthesia no se pueden crear sin el consentimiento explícito del ser humano al que representan, no nos dedicamos a las falsificaciones profundas no consensuadas, lo que limita significativamente el potencial de abuso de nuestra plataforma y de los avatares personales específicamente”.
Cuando se le preguntó si hay avatares personales o avatares en general que Synthesia no permitirá, Voica dijo que la compañía utiliza filtros tecnológicos avanzados y moderación de contenido humano para asegurarse de que Synthesia no se utilice para facilitar la creación de contenido inapropiado o dañino.
“Cuando alguien intenta hacer un video, ese contenido se someterá a nuestro flujo de trabajo de moderación de contenido antes de generarse”, dijo Voica. Descifrar“Si se descubre que infringe nuestras políticas, el video nunca se crea. Los infractores reincidentes o las infracciones graves también pueden dar lugar a la desactivación de su cuenta”.
Creando tu avatar
Para comenzar, los usuarios deben crear una cuenta de Synthesia. Los avatares personales están disponibles en las cuentas de terceros “Starter”, “Creator” y “Enterprise”. La suscripción anual para las cuentas Starter y Creator varía entre $18 y $59 al mes, respectivamente. Las empresas que buscan una licencia empresarial deben comunicarse con Synthesia para determinar Precios.
El proceso funcionó mejor en mi MacBook Pro que en mi PC con Windows 11, ambos usando el navegador Brave. Cuando esté listo, Synthesia le preguntará si desea grabar directamente desde la plataforma o cargar un video. Creo que grabar.

Según Synthesia, un avatar personal se crea utilizando una forma avanzada de tecnología de bucle llamada alineación automática, que puede determinar cuándo un avatar está hablando y hace que los movimientos corporales sean más receptivos. Los idiomas disponibles para los avatares personales incluyen inglés, alemán, francés, español, árabe, croata, filipino, griego, hindi, italiano, rumano, ruso, turco y ucraniano.
Antes de grabar, Synthesia recomienda utilizar un entorno tranquilo y bien iluminado, hacer pausas entre párrafos, no cubrirse el rostro, utilizar un lenguaje corporal natural, ser positivo y sonreír.
Según mi experiencia con la herramienta, otras recomendaciones son asegurarse de que la cámara no esté demasiado cerca para que no parezcas más pequeño en el encuadre. Si decides subir un vídeo en lugar de usar la grabadora, utiliza un micrófono para mejorar la calidad del audio.
Synthesia te dará un guion para leer, que tardarás aproximadamente tres minutos en recitar. Según el generador de avatares, se necesitan entre uno y cinco minutos de audio y video para completar el proceso.

El proceso fue relativamente simple para algo que podría tener un gran impacto en la marca de una empresa o un creador de contenido.
Si bien el proceso de carga, grabación y lectura del guión tomó menos de cinco minutos, Synthesia dijo que la generación real del Avatar personal puede llevar hasta 24 horas. Mi primer video tardó aproximadamente 10 horas en crearse. Después de eso, los videos posteriores que incluían nuevos guiones que proporcioné tardaron aproximadamente cinco minutos.
Aquí está mi avatar personal de Synthesia. ¿Qué opinas?
El tamaño del video final se puede modificar para que se ajuste a las necesidades de la plataforma a la que se subirá, ya sea YouTube, Instagram o TikTok. Descubrí que generar nuevos videos usando un nuevo script con un avatar personal tomaba aproximadamente cinco minutos.
Sin embargo, no puedes cambiar tu fondo, atuendo o apariencia sin generar un nuevo Avatar Personal, lo que, como se mencionó anteriormente, podría llevar hasta un día.
Si bien los avatares personales son muy impresionantes, fue extraño ver una versión animada de mí mismo, un ejemplo del “valle inquietante”. El valle inquietante es cuando una representación fotorrealista de un humano es casi demasiado parecida a la realidad, lo que hace que su apariencia sea aún más desconcertante.
A pesar de esto, estos avatares de video son impresionantes y podrían pasar por reales si el espectador no los examina con cuidado.
Editado por Ryan Ozawa.
Generalmente inteligente Hoja informativa
Un viaje de IA semanal narrado por Gen, un modelo de IA generativa.