Flujo (modelo de texto a imagen) - Enciclopedia
Flux (también conocido como FLUX.1) es un modelo de texto a imagen desarrollado por Black Forest Labs (BFL), con sede en Freiburg im Breisgau, Alemania. Black Forest Labs fue fundada por antiguos empleados de Stability AI. Al igual que otros modelos de texto a imagen, Flux genera imágenes a partir de descripciones naturales, denominadas prompts.
Historia
Black Forest Labs (BFL) fue fundada en 2024 por Robin Rombach, Andreas Blattmann y Patrick Esser, antiguos empleados de Stability AI. Los tres fundadores habían investigado previamente la generación de imágenes de inteligencia artificial en la Universidad Ludwig Maximilian de Múnich como asistentes de investigación bajo la dirección de Björn Ommer. Publicaron sus resultados de investigación sobre generación de imágenes en 2022, lo que resultó en la creación de Stable Diffusion. Inversores en BFL incluyen la firma de capital de riesgo Andreessen Horowitz, Brendan Iribe, Michael Ovitz, Garry Tan y Vladlen Koltun. La empresa recibió una inversión inicial de 31 millones de dólares.
En agosto de 2024, Flux se integró en el chatbot Grok desarrollado por xAI y se hizo disponible como parte de una función premium en X (anteriormente Twitter). Grok cambió más tarde a su propio modelo de texto a imagen Aurora en diciembre de 2024.
El 18 de noviembre de 2024, Mistral AI anunció que su chatbot Le Chat había integrado Flux Pro como su modelo de generación de imágenes.
El 21 de noviembre de 2024, BFL anunció el lanzamiento de Flux.1 Tools, una suite de herramientas de edición diseñadas para ser utilizadas sobre modelos Flux existentes. Las herramientas consisten en Flux.1 Fill para el pintado y el relleno, Flux.1 Depth para el control basado en el mapa de profundidad extraído de las imágenes de entrada y los prompts, Flux.1 Canny para el control basado en los bordes canny extraídos de las imágenes de entrada y los prompts, y Flux.1 Redux para la mezcla de imágenes de entrada y prompts. Cada herramienta está disponible en modelos Pro y Dev.
En enero de 2025, BFL anunció una asociación con Nvidia para la inclusión de modelos Flux como modelos de base para la microarquitectura Blackwell de Nvidia. La empresa también anunció el lanzamiento de Flux Pro Finetuning API, diseñado para la personalización y el ajuste fino de imágenes generadas por Flux y una asociación con la empresa de medios alemana Hubert Burda Media para el uso de Flux Pro como parte de la creación de contenido.
El 29 de mayo de 2025, BFL anunció Flux.1 Kontext, una suite de modelos que permiten la generación y edición de imágenes en contexto, permitiendo a los usuarios utilizar prompts tanto con texto como con imágenes. Junto con esto, se lanzó BFL Playground, una interfaz para probar modelos Flux.
Modelos
Flux es una serie de modelos de texto a imagen. Los modelos se basan en bloques de transformadores de flujo rectificado escalados a 12 mil millones de parámetros. Los modelos Flux.1 se lanzaron bajo diferentes licencias, con Schnell (que significa Rápido o Rápido en alemán) lanzado como software de código abierto bajo la Licencia Apache, Dev lanzado como software de código disponible bajo una licencia no comercial (los usuarios pueden obtener una licencia comercial de autoservicio para Dev de BFL) y Pro lanzado como software propietario y disponible solo como API que puede ser licenciado por usuarios de terceros. Los usuarios conservan la propiedad de los resultados generados independientemente de los modelos utilizados.
Los modelos pueden utilizarse tanto en línea como localmente mediante el uso de interfaces de usuario de IA generativa como ComfyUI y Stable Diffusion WebUI Forge (un bifurcación de Automatic1111 WebUI).
Se lanzó un modelo insignia mejorado, Flux 1.1 Pro, el 2 de octubre de 2024. Se añadieron dos modos adicionales el 6 de noviembre, Ultra que puede generar imágenes a una resolución cuatro veces mayor y hasta 4 megapíxeles sin afectar la velocidad de generación y Raw que puede generar imágenes hiperrealistas en el estilo de fotografía de autorretrato.
Flux.1 Kontext es una serie con capacidades de generación y edición de imágenes en contexto. Está disponible en modelos Pro, Max y Dev. Pro es el modelo de más alta calidad y se puede usar para modificar iterativamente una imagen existente utilizando prompts, mientras que Max está optimizado para la velocidad de generación. Dev es un modelo de peso abierto lanzado bajo una licencia no comercial, igual que Flux.1 Dev.
Relacionado con Flux está el modelo de texto a video SOTA, en desarrollo hasta junio de 2025.
Recepción
De acuerdo con una prueba realizada por Ars Technica, los resultados generados por Flux.1 Dev y Flux.1 Pro son comparables con DALL-E 3 en términos de fidelidad de prompt, con la fotorealismo que coincide con Midjourney 6 y las manos generadas con mayor consistencia en comparación con modelos anteriores como Stable Diffusion XL.
Flux ha sido criticado por sus imágenes generadas muy realistas. Según informes de los medios, las representaciones iban desde una imagen de Donald Trump posando con armas hasta escenas perturbadoras, lo que desató discusiones sobre las implicaciones éticas de los modelos Flux.
Después del lanzamiento del modelo, la plataforma de redes sociales X se inundó de imágenes generadas por Flux. Black Forest Labs no ha proporcionado detalles exactos de los datos utilizados para entrenar el modelo. Ars Technica sospecha que Flux se basa en una gran colección no autorizada de imágenes raspadas de internet, una práctica controvertida con posibles consecuencias legales.
De acuerdo con una prueba realizada por el sitio web de noticias tecnológicas japonés Gigazine para Flux.1 Kontext, la serie de modelos tiene una buena comprensión del idioma inglés y puede transferir fácilmente el estilo de la imagen de fotorealista al estilo anime según los prompts dados por el usuario, sin embargo, su capacidad para entender el idioma japonés es bastante pobre.
Disponibilidad
Además del BFL Playground oficial en su sitio web, los modelos Flux también están ampliamente disponibles a través de diversas plataformas de terceros para uso creativo y profesional. Esto incluye repositorios en plataformas como Hugging Face y Replicate.
Referencias
Enlaces externos
Sitio web oficial
Modelos Flux en Hugging Face
Modelos Flux en Replicate
Modelos Flux en FAL.ai