Black Forest Labs
Black Forest Labs ist ein KI-Forschungsunternehmen, das 2024 vom ursprünglichen Stable Diffusion-Team von Stability AI (Robin Rombach, Andreas Blattmann, Patrick Esser) gegründet wurde. Das Unternehmen entwickelt FLUX, eine Familie von State-of-the-Art Text-zu-Bild-Modellen mit überlegener Prompt-Befolgung, Textwiedergabe und Bildqualität. Stand Oktober 2025 repräsentieren FLUX.1-Modelle (Schnell, Dev, Pro) führende Open-Source und kommerzielle Bildgenerierung, wobei FLUX.1 Pro mit Midjourney und DALL-E 3 konkurriert. Das Unternehmen bietet API-Zugang über BFL API und Replicate, mit Open-Source-Modellen auf Hugging Face unter Apache 2.0 und nicht-kommerziellen Lizenzen.
Überblick
Black Forest Labs entstand aus dem Team, das Stable Diffusion bei Stability AI entwickelt hat. Nach ihrem Weggang Anfang 2024 gründeten die Gründer BFL und veröffentlichten FLUX.1 im August 2024, das sofortige Anerkennung für überlegene Textwiedergabe (Lösung von SDs Schwäche mit Text in Bildern), bessere Prompt-Befolgung und fotorealistische Qualität erlangte. Die FLUX-Architektur nutzt einen Hybrid-Ansatz, der Diffusions-Transformer mit Flow Matching kombiniert, trainiert auf einem kuratierten Datensatz mit sorgfältiger Aufmerksamkeit auf Lizenzierung. Die Mission des Unternehmens: Offene und zugängliche KI-Tools aufbauen und gleichzeitig kommerzielle Rentabilität durch API-Services und Pro-Lizenzierung aufrechterhalten.
FLUX-Modelle (Oktober 2025)
- FLUX.1 Schnell: Schnelles 4-Schritt-Modell, Apache 2.0 Lizenz, 1-2 Sek. Generierung, Open Source
- FLUX.1 Dev: Hochwertiges 50-Schritt-Modell, nicht-kommerzielle Lizenz, destillierte Führung
- FLUX.1 Pro: Bestes kommerzielles Qualitätsmodell via API, $0.03-0.04/Bild
- 12B Parameter, hybride Transformer-Architektur, überlegene Textwiedergabe
- Auflösung: 1024×1024 nativ, bis zu 2048×2048
- API: BFL API ($0.025/Schnell, $0.04/Pro), Replicate, Together AI
- Open Source: Hugging Face für Schnell und Dev Gewichte
Hauptinnovationen
- Textwiedergabe: Erstes Modell zur zuverlässigen Erzeugung lesbaren Textes in Bildern
- Prompt-Befolgung: Bessere Anweisungsbefolgung als SDXL oder Midjourney v6
- Flow Matching: Neuartige Trainingstechnik für schnellere Konvergenz
- Guidance-Destillation: Dev-Modell integriert Führung in die Gewichte
- Schnelle Inferenz: Schnell generiert in 1-2 Sekunden (4 Schritte)
- Open Source: Schnell vollständig offen (Apache 2.0), Dev verfügbar für Forschung
- Kommerzielle Rentabilität: API-Preise wettbewerbsfähig mit DALL-E 3
- Community-Adoption: Integriert in ComfyUI, A1111, Fooocus
Code-Beispiel
# FLUX via Replicate API
import replicate
output = replicate.run(
"black-forest-labs/flux-schnell",
input={
"prompt": "A sign that says 'FLUX' in neon lights, cyberpunk style",
"num_outputs": 1,
"aspect_ratio": "1:1",
"output_format": "png"
}
)
print(output) # URL to generated image
# FLUX via BFL API
import requests
response = requests.post(
"https://api.bfl.ml/v1/flux-pro",
headers={"X-Key": "your_api_key"},
json={
"prompt": "Product photo of a coffee mug with 'Good Morning' text",
"width": 1024,
"height": 1024,
"steps": 50
}
)
result = response.json()
image_url = result["result"]["sample"]
# FLUX locally with diffusers
from diffusers import FluxPipeline
import torch
pipe = FluxPipeline.from_pretrained(
"black-forest-labs/FLUX.1-schnell",
torch_dtype=torch.bfloat16
).to("cuda")
image = pipe(
"A magazine cover with headline 'AI Revolution 2025'",
num_inference_steps=4,
guidance_scale=0.0 # Schnell doesn't use guidance
).images[0]
image.save("flux_output.png")
FLUX vs. Konkurrenz (Oktober 2025)
FLUX.1 Pro: Beste Textwiedergabe, exzellente Prompt-Befolgung, $0.04/Bild. Midjourney v6.1: Überlegene Ästhetik für künstlerische Bilder, $10-30/Monat Abonnement. DALL-E 3: Hervorragende Sicherheitsfilter, ChatGPT-Integration, $0.04-0.08/Bild. Stable Diffusion 3.5: Open Source, gute Qualität, schwächere Textwiedergabe. FLUX-Vorteile: Erstklassige Textgenerierung, Open-Source-Optionen (Schnell), schnelle Inferenz (1-2 Sek.), Apache 2.0 Lizenz für kommerzielle Nutzung. Beste Wahl für: Anwendungen, die Text in Bildern benötigen (Marketing, Beschilderung, Memes), Entwickler, die Open-Source-Modelle wünschen, schnelle Generierungsanforderungen.
Anwendungsfälle
- Marketing: Produktfotos mit Textbeschriftungen, Anzeigen, Social Media
- Meme-Generierung: Textlastige Bilder mit zuverlässiger Darstellung
- UI/UX-Mockups: Designs mit lesbarem Button-Text und Beschriftungen
- Publishing: Magazin-Cover, Buch-Cover mit Titeln
- Bildung: Diagramme und Infografiken mit Textannotationen
- E-Commerce: Produktvisualisierung mit Verpackungstext
- Beschilderung: Ladenschilder, Werbetafeln, Banner
- Branding: Logos und Markeninhalte mit Textelementen
Professionelle Integrationsdienste von 21medien
21medien bietet FLUX-Integrationsdienste an, einschließlich API-Implementierung, individuellem Fine-Tuning, Batch-Verarbeitungs-Pipelines und Produktions-Deployment. Unser Team ist spezialisiert auf die Optimierung von FLUX für spezifische Anwendungsfälle, Integration in Design-Workflows und den Aufbau automatisierter Bildgenerierungssysteme. Für detaillierte FLUX-Implementierungsanleitungen siehe unseren Blogbeitrag: FLUX.1 von Black Forest Labs (Beitrag #21). Kontaktieren Sie uns für individuelle FLUX-Lösungen.
Ressourcen
Offizielle Website: https://blackforestlabs.ai | FLUX-Modelle: https://huggingface.co/black-forest-labs | API-Dokumentation: https://docs.bfl.ml | Blogbeitrag: /en/blog/flux1-black-forest-labs-image-ai