Dream Machine (text-to-video model) - Enciclopedia
Dream Machine es un modelo de texto a video creado por Luma Labs y lanzado en junio de 2024. Genera salida de video basada en sugerencias de usuarios o imágenes estáticas. Dream Machine ha sido destacado por su capacidad para capturar movimiento de manera realista, aunque algunos críticos han señalado la falta de transparencia sobre sus datos de entrenamiento.
Historia
Dream Machine es un modelo de texto a video creado por la empresa de inteligencia artificial generativa con sede en San Francisco, Luma Labs, que anteriormente creó Genie, un generador de modelos 3D. Fue lanzado al público el 12 de junio de 2024, lo que la empresa anunció en un post en X junto con ejemplos de videos que creó. Poco después de su lanzamiento, usuarios en redes sociales publicaron versiones en video de imágenes generadas con Midjourney, así como recreaciones en movimiento de obras de arte como "La joven con la perla" y memes como Doge, Picard facepalm, Success Kid y el novio distraído. Un video, un tráiler de una película animada ficticia titulada Monster Camp, fue republicado por Luma Labs en su cuenta de X. Los usuarios en la plataforma criticaron el video por robar el estilo de la franquicia Monsters, Inc., también señalando que Mike Wazowski, un personaje de la franquicia, aparece en el tráiler. Otro video publicado por la directora Ellenor Argyropoulos de una animación de estilo Pixar de una niña en el antiguo Egipto creada con Dream Machine se volvió viral en línea.
Capabilities
Hasta junio de 2024, los usuarios pueden crear videos con Dream Machine, que tienen una duración de cinco segundos y una resolución de 1360 × 752 píxeles, al registrarse con su cuenta de Google y escribir una sugerencia o usar una imagen estática. Dream Machine altera la sugerencia basándose en su propio gran modelo de lenguaje. Los usuarios pueden crear 10 videos al día y 30 videos gratuitos con Dream Machine. El programa también ofrece planes de suscripción estándar, Pro y Premier, que permiten a los usuarios crear 120, 400 y 2,000 videos, respectivamente. El sitio web de Dream Machine afirma que sus videos tienen dificultades para representar texto y movimiento. Luma Labs ha afirmado que tiene planes para lanzar una API amigable con desarrolladores para Dream Machine. La semana después de su lanzamiento, Luma Labs anunció que añadiría la capacidad de extender videos, una función de descubrimiento y edición dentro del video.
Recepción
Los críticos compararon Dream Machine intensamente con Sora, un modelo de texto a video creado por OpenAI, y Kling, otro modelo de texto a video, al momento de su lanzamiento. Charles Pulliam-Moore de The Verge escribió que los "fans entusiastas" de la inteligencia artificial generativa "fueron rápidos en llamar [a Dream Machine] una innovación novedosa", pero comentó sobre la falta de disponibilidad pública de sus datos de entrenamiento. Mark Wilson de TechRadar también señaló que no estaba claro qué eran los datos de entrenamiento de Dream Machine, lo que dijo que "significa que su potencial más allá del uso personal o mejorar su juego de GIF podría estar limitado", pero escribió que era "ciertamente una herramienta divertida para probar" como "un anticipo de los generadores de video de inteligencia artificial más avanzados (y sin duda más caros) que vendrán". Para Tom's Guide, Ryan Morrison llamó a Dream Machine "uno de los mejores modelos de video de inteligencia artificial con seguimiento de sugerencias y comprensión de movimiento", y "un paso impresionante en el video de inteligencia artificial generativa", pero que "aún no alcanza lo necesario". Chase DiBenedetto de Mashable describió los videos de Dream Machine creados por usuarios que circulan en redes sociales como "misteriosamente movidos" y "al estilo Harry Potter".
Referencias
Enlaces externos
Sitio web oficial