Kling 2.0, una importante actualización del generador de videos AI de Cutting -ED Publicado por la compañía de tecnología china Kuaishou, golpeó el mercado la semana pasada para un flujo de reacciones impresionantes de los creadores, que rápidamente quemaron cientos de dólares probando sus capacidades.
“La calidad del video de la IA solo 10 veces del día del día”. Nunca he visto ningún movimiento de este fluido o invita tan preciso. “La publicación ha recopilado más de 757,000 vistas, destacando el zumbido en torno a esta versión.
AI Calidad Video Insul 10x’d Night Dight. Estoy sin palabras.
Kling 2.0 acaba de caer y ya he quemado $ 1,250 en créditos que prueban sus límites.
Nunca he visto este fluido de movimiento o invitación tan precisa.
Así es exactamente cómo hice este video, paso a paso 👇🧵 pic.twitter.com/f54efvlczj– PJ Ace (@PJactTuro) 15 de abril de 2025
La nueva versión marca un enlace frente a Kling 1.6, ofreciendo una comprensión rápida mejorada, un movimiento de movimiento más fluido y una estética visual mejorada que los usuarios describen como una apariencia “filmada, no generada”. Más específicamente, Kling 2.0 puede generar videos hasta 2 minutosDeje competidores como Openi Sora en polvo con respecto a extensas posibilidades narrativas.
“En general, Kling mantiene el primer lugar en el aula adiós. Él piensa que es el ganador ligero de la generación de videos en video, la competencia está más cerca con respecto a una generación directa de texto de texto.
Esta nueva versión llega a un mercado de generación de videos AI cada vez más congestionado. Los competidores incluyen Runway, conocida por las salidas de alta fidelidad, que recientemente publicó su modelo V4, centrado en los resultados cinematográficos, y VEO2 de Google, con sus robustas capacidades de texto de video y agradables resultados estéticos.
Hasta ahora, el modelo aún no se ha presentado en el análisis artificial ” Clasificación del generador de videos– que clasifica todos los mejores modelos de video generativos, pero su predecesor, Kling 1.6 ya es el líder de la imagen en video y ocupa el segundo lugar en el texto de video basado en pruebas ciegas.

Kling 2.0 tiene un editor de elementos múltiples, lo que permite a los usuarios agregar, intercambiar o eliminar contenido de video utilizando entradas de texto o imagen.
La plataforma también presenta dos componentes especializados: Kling 2.0 Master para la generación de videos y Kolors 2.0 para la creación de imágenes, no se puede confundir con otro generador de IA chino de código abierto que se ha publicado Bajo el mismo nombre “Kolor”– Dar a los creadores más control sobre sus salidas.

El acento de la herramienta de calidad de la película lo hace particularmente atractivo para los cineastas, especialistas en marketing y creadores de contenido. El modelo es extremadamente poderoso en términos de recursos, generaciones que toman horas en el plan gratuito y hasta 16 minutos durante casi 5 segundos de video en plataformas en línea.
El precio comienza en $ 29 por mes para el plan estándar, que incluye modo profesional, videos de 8 segundos y una asignación de 30 videos por día. Un plan gratuito ofrece 6 generaciones diarias con límites de 4 segundos y marca de agua. El plan profesional, a $ 89 por mes, ofrece alta resolución, controles avanzados de movimiento y tratamiento prioritario.
Prueba el modelo
Hemos probado el nuevo modelo en cinco categorías: dinamismo, ilustración, texto de video, coherencia estructural y coherencia de sujetos múltiples. Esto es lo que encontramos.
Dinamismo
Todos los generadores de video administran bien las escenas, pero generalmente luchan con un movimiento rápido, escenas complejas y una configuración dinámica. Esto refleja un video o animación real: explique su televisor durante un enjuiciamiento de “Tom & Jerry” o una escena de guerra llena de acción, y verá marcos extraños en todas partes.
Probamos el modelo con una imagen inmóvil de un hombre volador en una ciudad y le pedimos que generara la escena.
Kling 2.0 demostró ser extremadamente sensible a cambios rápidos menores. Nuestro primer intento se utilizó: “Trazo de seguimiento dinámico: un hombre vuela a velocidades extremadamente altas en una calle animada de la ciudad. La cámara sigue de cerca, capturando la avalancha de edificios y el tráfico silbando, mejorando la sensación de velocidad y Joie de Vivre después de dar un giro animado”.
Desafortunadamente, la invitación generó la ilusión de un sujeto de una manera chupada en la calle. Esto probablemente se debió a nuestra elección de palabras en el aviso.
Así que eliminamos una sola palabra: “detrás”. Esto ha cambiado el resultado, produciendo un video mucho mejor que muestra el volante, frente a la cámara.
Kling capturó los elementos clave de la escena, un movimiento dinámico y rápido, aunque el cuerpo del sujeto se ha transformado extrañamente durante el cambio de dirección, y ciertos elementos carecían de una estructura uniforme. Otros modelos como el dinamismo comercial VEO2 de Google para el realismo, creando escenas más lentas, más estáticas pero más consistentes.
Ilustración
Invite: “Panorgrama horizontal de 360 grados: una ciudad animada en una forma compleja alrededor de un árbol sólido, lleno de casas y puentes. La cámara se mueve suavemente de la parte delantera a la parte trasera del árbol, capturando a los niños que juegan, las personas atractivas en las actividades diarias y los autos voladores que aterrizan en las ramas y despegan, todo bajo una atmósfera cálida e invitada”.
El modelo sobresale con estilos imaginativos como cómics e ilustraciones, pero lucha con detalles menores. Prioriza la consistencia en los detalles, respetando los principales elementos rápidos con un movimiento de cámara suave y una escena fluida.
La estructura de los objetos permanece sólida sin los temblores vistos en otros generadores, aunque algunos niños (que serían pequeños detalles más allá de la estructura original de toda la composición: un árbol y la ocupación a su alrededor) pierden la consistencia y los autos voladores desaparecen ocasionalmente.
Sin embargo, esta prueba produjo los mejores resultados que hemos visto en cualquier generador de video.
Video de texto
Invites: “Una mujer rubia con un vestido rojo y un hombre asiático con traje negro charla dentro de un Starbucks. Partido”.
El texto de video tiene desafíos únicos para los generadores de IA. El modelo debe crear un marco inicial (esencialmente una tarea de texto de imagen) y usarlo como referencia para todos los siguientes marcos. Idealmente, desea un generador de imágenes especializado para este primer cuadro, e idealmente para el último cuadro también si desea la mejor consistencia.
Kling 2.0 no es particularmente brillante aquí, pero tampoco está mal. La escena tiene el estilo de avión característico común a muchos generadores de imágenes, pero los cuerpos mantienen una estructura apropiada, los dedos parecen precisos y no hay artefactos perceptibles que perturben la escena.
Es una mejora en comparación con Kling 1.6, pero no con lo que el modelo fue diseñado.
Consistencia estructural
Invitar: “Vista aérea: foto de una estructura arquitectónica abstracta que gira el complejo”.
Aunque Kling puede luchar con pequeños detalles en escenas abarrotadas, se destaca en mantener la consistencia y los detalles en disparos simples.
Compartimos una imagen de una habitación compleja y le pedimos al modelo que la ejecute. Kling 2.0 logró esto casi perfectamente: la iluminación permaneció coherente, el movimiento era uniforme, no aparecía artefactos y la estructura mantuvo su integridad.
Esta capacidad lo hace potencialmente precioso para el modelado 3D, lo que permite descripción general de objetos y etapas desde diferentes ángulos.
Coherencia de múltiples sujetos
Invite: “Cinco cachorros de lobo gris y continúan alrededor de un camino de grava aislado, rodeado de hierba. Los cachorros corren y saltan, continúan y se muerden, jugando”.
Este sigue siendo el talón de Aquiles de todos los modelos de video, incluido Kling 2.0. Dado que OpenAi mostró que Sora no generó un montón de animales de bebé que juegan juntos, todos los generadores de video han intentado este desafío con resultados mixtos. Ningún modelo alcanza constantemente resultados perfectos.
Kling 2.0 ha generado una escena animada y realista, pero los lobos se fusionan entre sí, apareciendo y desapareciendo entre los marcos. Si lo único analizado es la consistencia, no hay mucha diferencia entre Kling 2.0 y Kling 1.6.
Una mejora notable: las irregularidades ocurren principalmente en el fondo, lo que lleva a los animales ahora una mejor consistencia la mayor parte del tiempo.
Kling 2.0 es accesible a través de Kling aiFreepik, Polo ai y otros proveedores.
Generalmente inteligente Boletín
Un viaje semanal de IA contado por Gen, un modelo de generador de IA.
