Flux.1: Was kann das neue Bild-KI Model aus Deutschland?

Flux.1: Der neue Star am Bild-KI-Himmel?

Ein neuer Player mischt die Welt der KI-Bildgenerierung auf: Flux.1 von Black Forest Labs. Gerade erst angekündigt, sorgt das Tool bereits für Furore in der Kreativ- und Tech-Szene.

 

Das Versprechen? Nicht weniger als der neue Industriestandard für generative Medien zu werden. Ein gewagtes Ziel angesichts der Konkurrenz durch Midjourney, DALL-E und Co.

 

Aber hat Flux.1 wirklich das Zeug dazu? Kann es in Sachen Bildqualität und kreative Vielfalt mithalten oder sogar die Platzhirsche übertrumpfen?

 

In diesem Beitrag nehmen wir Flux.1 unter die Lupe, zeigen dir, wie du es selbst testen kannst und was bei der kommerziellen Nutzung zu beachten ist.

 

➡️ Was ist dran am Hype? Hat Flux.1 eine echte Chance gegen Midjourney? Die Antworten findest du in unserem großen Bild-KI Vergleich 2024.

 

PS: alle gezeigten Bilder im Beitrag wurden mit Flux.1 [dev] lokal generiert.

Inhaltsverzeichnis

Wer steckt hinter Flux.1? Das Black Forest Labs Team

Black Forest Labs ist kein Newcomer im klassischen Sinne. Hinter dem Unternehmen steht ein Team von KI-Experten, die du vielleicht schon kennst – wenn nicht namentlich, dann durch ihre Arbeit:

 

  • Sie waren maßgeblich an der Entwicklung von VQGAN, Latent Diffusion und den Stable Diffusion Modellen beteiligt.
  • Ihre Innovationen umfassen Stable Diffusion XL, Stable Video Diffusion und Rectified Flow Transformers.
  • Sie brachten uns Adversarial Diffusion Distillation für ultraschnelle Bildsynthese in Echtzeit.

 

Kurz gesagt: Wir haben es hier mit echten Schwergewichten der KI-Forschung zu tun.

Finanzierung und Unterstützung

Dass die Tech-Welt große Hoffnungen in Black Forest Labs setzt, zeigt sich an der beeindruckenden Finanzierung:

  • 31 Millionen Dollar in der Seed-Finanzierungsrunde
  • Hauptinvestor: Andreessen Horowitz
  • Weitere namhafte Investoren wie Brendan Iribe, Michael Ovitz und Garry Tan

 

Zusätzlich konnte Black Forest Labs einen hochkarätigen Beirat gewinnen, darunter Michael Ovitz (Erfahrung in der Content-Branche) und Prof. Matthias Bethge (Pionier des Neural Style Transfer).

 

Mit dieser Kombination aus Expertise, Finanzkraft und strategischer Unterstützung positioniert sich Black Forest Labs als ernstzunehmender Player im KI-Markt. Ob sie ihrem Anspruch, den Industriestandard neu zu definieren, gerecht werden können, bleibt spannend zu beobachten.

Die Flux.1 Modellfamilie im Überblick

Black Forest Labs startet nicht mit einem einzelnen Modell, sondern gleich mit einer ganzen Modellfamilie. Flux.1 kommt in drei Varianten, die unterschiedliche Anwendungsszenarien und Nutzergruppen bedienen:

Diese Aufstellung zeigt, dass Black Forest Labs verschiedene Nutzerbedürfnisse berücksichtigt – vom Hobby-Künstler bis zum Enterprise-Kunden. Besonders interessant für unsere Community dürfte Flux.1 [dev] sein, das hochwertige Ergebnisse bei einfachem Zugang verspricht.

Im nächsten Abschnitt werfen wir einen Blick unter die Haube und schauen uns an, was Flux.1 technologisch von anderen Modellen unterscheidet.

  1. Flux.1 [schnell]
    • Optimiert für lokale Entwicklung und persönlichen Gebrauch
    • Schnellstes Modell der Familie
    • Open Source unter Apache 2.0 Lizenz
    • Verfügbar auf HuggingFace, GitHub und in HuggingFace’s Diffusers

Flux.1 [dev]
• Open-Weight-Modell für nicht-kommerzielle Anwendungen
• Direkt von Flux.1 [pro] abgeleitet, mit ähnlicher Qualität
• Effizienter als Standardmodelle gleicher Größe
• Frei verfügbar auf HuggingFace, Replicate und Fal.ai

Flux.1 [pro]
• Das Flaggschiff-Modell mit Spitzenleistung in Bildgenerierung
• Herausragende Prompt-Befolgung, visuelle Qualität und Detailgrad
• Zugänglich über API, Replicate und fal.ai
• Maßgeschneiderte Enterprise-Lösungen verfügbar

Diese Aufstellung zeigt, dass Black Forest Labs verschiedene Nutzerbedürfnisse berücksichtigt – vom Hobby-Künstler bis zum Enterprise-Kunden. Besonders interessant für unsere Community dürfte Flux.1 [dev] sein, das hochwertige Ergebnisse bei einfachem Zugang verspricht.

Im nächsten Abschnitt werfen wir einen Blick unter die Haube und schauen uns an, was Flux.1 technologisch von anderen Modellen unterscheidet.

Technologie hinter Flux.1: Was macht es besonders?

Flux.1 ist nicht einfach nur ein weiteres Diffusionsmodell. Black Forest Labs hat hier einige interessante technologische Innovationen eingebaut:

 

  1. Hybride Architektur
    • Kombination aus multimodalen und parallelen Diffusions-Transformer-Blöcken
    • Skaliert auf beeindruckende 12 Milliarden Parameter

  2. Flow Matching
    • Basiert auf einer allgemeinen und konzeptionell einfachen Methode zum Training generativer Modelle
    • Diffusion ist hier nur ein Spezialfall – Flux.1 geht darüber hinaus

  3. Verbesserte Hardware-Effizienz
    • Einsatz von rotierenden Positionseinbettungen (rotary positional embeddings)
    • Verwendung paralleler Attention-Layer

  4. Breite Unterstützung verschiedener Seitenverhältnisse
    • Flexibel für Ausgaben zwischen 0,1 und 2,0 Megapixel
    • Ideal für verschiedene Anwendungsfälle im Marketing und Design

 

Diese technischen Besonderheiten versprechen nicht nur eine Verbesserung der Bildqualität und Prompt-Treue, sondern auch eine erhöhte Effizienz und Vielseitigkeit.

 

Black Forest Labs hat angekündigt, in naher Zukunft einen detaillierten technischen Bericht zu veröffentlichen. Wir werden euch auf dem Laufenden halten, sobald dieser verfügbar ist.

 

Was diese technischen Innovationen in der Praxis bedeuten? Das schauen wir uns im nächsten Abschnitt an, wo wir Flux.1 auf Herz und Nieren geprüft haben.

Flux.1 im Praxistest: Hält es, was es verspricht?

Die Ankündigung klingt vielversprechend, aber wie schlägt sich Flux.1 im direkten Vergleich mit den etablierten Größen? Wir haben es ausgiebig getestet und mit Midjourney, DALL-E 3, Adobe Firefly und Stable Diffusion verglichen.

 

Die detaillierten Ergebnisse findest du in unserem großen Bild-KI Vergleich 2024.

Hier schon mal ein Appetithappen:

Besondere Stärken:

  • Packagingdesign
  • Interiordesign
  • Sehr gute Textwiedergabe

Kleinere Schwächen bei Detailaspekten und Look & Feel oft zu weich/kindlich

• Im Vergleich:

  • Midjourney 6.1 noch vorne bei Detailgenauigkeit und komplexen Prompts
  • Flux.1 etabliert sich als ernstzunehmender Konkurrent

• Vorteile als Open-Source-Lösung:

  • Maximale Flexibilität für Nutzer
  • Gute Integration in bestehende Workflows
  • Anpassungsmöglichkeiten

 

Persönliche Beobachtungen:

  1. Flux.1 neigt eher zu gefälligem, süßem und glattgebügeltem Output, wenn der Prompt genug Spielraum lässt. Gerade für realistische Fotos braucht es also ausführliche Prompts wie noch zu Stable Diffusion 1.5 Zeiten. Beschreibt alles exakt, von Hauttextur über Hintergrund, Atmosphäre uvm. 
  2. Alter: Ich nutze gerne Altersangaben wie „40 year old woman“ in meinen Prompts für direkten Kontext. Diese Angaben führen tendenziell aber zu zu alten Menschen. Ein „40 year old man“ wirkt eher wie 50 oder 60+.
  3. Textwiedergabe: Funktioniert auf Englisch deutlich besser als auf deutsch. „Lokal generiert mit Flux“ konnte ich nicht fehlerfrei generieren „generated locally with flux“ schon.

 

Alle Details, Bildbeispiele und unsere ausführliche Analyse findest du in unserem Vergleichstest.

Neugierig geworden? Im nächsten Abschnitt zeigen wir dir, wie du Flux.1 selbst ausprobieren kannst.

So kannst du Flux.1 jetzt ausprobieren

Hey, du willst Flux.1 selbst testen? Wir zeigen dir, wie’s geht! Du hast mehrere Möglichkeiten:

 

Webtools für den schnellen Start:

  • Replicate: Perfekt für den einfachen Einstieg. Hier kannst du Flux.1 direkt im Browser ausprobieren, ohne Installation.

  • fal.ai: Noch eine tolle Option für’s Online-Testen. Ideal, wenn du Flux.1 schnell und unkompliziert ausprobieren möchtest.

 

Diese Webtools sind super, um einen ersten Eindruck zu bekommen. Aber für volle Kontrolle und Anpassungsmöglichkeiten empfehlen wir die lokale Installation:

Lokale Generierung mit ComfyUI

Aktuell läuft Flux.1 lokal am besten über ComfyUI. Hier die Schritte:

  1. Hardware-Check: Du brauchst mindestens 24GB VRAM und 32GB RAM. Kein Leichtgewicht, aber für KI-Enthusiasten machbar!

  2. ComfyUI updaten: Stell sicher, dass du die neueste Version hast.

  3. Text-Encoder besorgen:

  4. VAE installieren:

  5. Flux1-schnell installieren:

  6. Workflow einrichten:


Fun Fact: Die „schnell“-Version von Flux.1 bietet dir 1 bis 4 Schritte und kommt mit einer Apache 2.0 Lizenz. Perfect für schnelles Experimentieren!

Kommerzielle Nutzungsrechte von Flux.1

Hey, aufgepasst! Bei Flux.1 gibt’s in Sachen Nutzungsrechte einiges Spannendes:

• Flux.1 [schnell]: Der Allrounder mit Freiheiten

  • Apache 2.0 Lizenz: Volle kommerzielle Nutzung erlaubt
  • Perfekt für lokale Entwicklung und persönlichen Gebrauch
  • Offen verfügbar auf Hugging Face und mit ComfyUI-Integration

• Flux.1 [dev]: Der Open-Weight-Champion für Experimentierfreudige

  • Freie Nutzung für nicht-kommerzielle Anwendungen
  • Ähnliche Qualität wie [pro], aber effizienter
  • Für kommerzielle Nutzung: Kontakt via flux@blackforestlabs.ai

• Flux.1 [pro]: Das Powerhouse für Profis

  • Topnotch Performance für State-of-the-Art Bildgenerierung
  • Verfügbar über API, Replicate und fal.ai
  • Enterprise-Lösungen auf Anfrage
  • Für kommerzielle Nutzung freigegeben

 

Unser Tipp: Mit [schnell] kannst du sofort loslegen – auch kommerziell. Perfekt zum Experimentieren und für kleinere Projekte. Für größere kommerzielle Vorhaben lohnt sich ein Blick auf [pro] oder eine Anfrage für maßgeschneiderte Lösungen.

Denk dran: Die KI-Welt dreht sich schnell. Behalte die Entwicklungen im Auge und wähle das Flux.1-Modell, das am besten zu deinen Projekten und deinem Budget passt. Egal ob du mit [schnell] startest oder gleich auf [pro] setzt – mit Flux.1 bist du für innovative Bildgenerierung gerüstet!

Du willst den KI-Hype nicht nur verstehen, sondern auch für dein Marketing nutzen? Dann ist das KI Marketing Bootcamp genau das Richtige für dich!

In nur 8 Stunden, verteilt auf drei Wochen, lernst du von den erfahrenen KI-Experten Vroni Hackl und Georg Neumann alles, was du brauchst, um generative KI strategisch und effizient einzusetzen. Egal ob Textgenerierung mit GPT-4, Bildkreation mit Stable Diffusion oder fortgeschrittene Anwendungen – im Bootcamp erhältst du das nötige Hintergrundwissen und praktische Skills für deinen Marketing-Alltag.

 

Keine Luftschlösser, sondern handfeste Strategien und Workflows stehen im Fokus. Sichere dir jetzt deinen Wettbewerbsvorsprung und melde dich noch heute an!

Wer hat's geschrieben?

Das könnte Dich auch interessieren:
Aktuelles
Nudging und KI: Warum sanfte Stupser beim Lernen mit KI nicht reichen

Nudging ist eines dieser Konzepte, die so elegant klingen, dass man sie sofort auf alles anwenden will. Ein kleiner Stupser in die richtige Richtung, eine geschickte Voreinstellung, eine kaum merkliche Veränderung der Umgebung, und schon verhalten sich Menschen besser. Funktioniert in Kantinen, beim Organspende-Register, bei Cookie-Bannern. Warum nicht auch beim Lernen mit KI? Ich höre die Idee regelmäßig in Seminaren, besonders von Führungskräften: „Können wir nicht einfach ein paar Nudges einbauen? Ein Pop-up, das fragt:

Weiterlesen »
KI im Einsatz
12 KI-Nudges: Kleine Stupser für mehr KI-Praxis

KI-Nudges, um besser in die Praxis zu kommen! Doch was ist das überhaupt? Nudges sind kleine Schubser für dein Verhalten. Man kennt sie zum Beispiel aus der Kantine: Wenn statt dem Schnitzel der Salat vorne steht, kann das ein geplanter Schubser sein, damit du zur gesünderen Wahl greifst. Ich habe mir überlegt, mit welchen Nudges man die praktische Nutzung von KI verbessern kann. Im Nudging-Artikel habe ich beschrieben, warum klassisches Nudging beim Lernen mit KI

Weiterlesen »
KI im Einsatz
Vibecoding im Marketing: Warum Marketer jetzt programmieren lernen, ohne programmieren zu lernen

Vor drei Monaten hätte ich nicht geglaubt, dass ich das schreibe: Ich baue gerade eine Browser Extension. Sie erfasst, wie Menschen KI generierte Texte editieren. Ein Forschungstool für meine Arbeit. Ich kann nicht programmieren. Ich habe nicht programmieren gelernt. Und trotzdem funktioniert das Ding. Der Grund hat einen Namen, der gerade durch die Tech Welt geistert: Agent Coding. Oder, wie Andrej Karpathy es Anfang 2025 nannte: Vibecoding. Die Idee ist simpel und radikal zugleich. Du

Weiterlesen »
Aktuelles
„Was euch nicht gehört, könnt ihr nicht verkaufen“ – Was drei Urteile für deinen KI-Einsatz bedeuten

Drei deutsche Gerichte haben innerhalb weniger Monate die Spielregeln für generative KI neu geschrieben. Die These ist unbequem, aber belastbar: Wer KI-Output als eigene kreative Leistung verkauft, ohne den menschlichen Gestaltungsbeitrag nachweisen zu können, steht rechtlich mit leeren Händen da. Und haftet trotzdem für alles, was rauskommt. Das betrifft nicht irgendwelche Tech-Konzerne in Kalifornien. Das betrifft jede Agentur, die nächste Woche ein KI-generiertes Logo an einen Kunden liefert. INPUT: Was die KI frisst – und

Weiterlesen »
ixel-Art-Illustration eines Detektivs im Trenchcoat und mit Sonnenbrille. Er hält ein leuchtend grünes Dokument mit der Aufschrift 'skills.md' in der Hand. Rechts daneben ist ein aufsteigender Aktienchart mit der Überschrift 'STONKS' zu sehen, sowie kleine Symbole für ein Gehirn, ein Zahnrad und eine Tastatur. Der Detektiv hat eine Sprechblase: 'SKILLS.MD: MUCH WOW, VERY AGENT.'
KI im Einsatz
Agent Skills schreiben: Anleitung mit Marketing-Beispielen

Im Analyse-Artikel über Skills Engineering habe ich beschrieben, warum strukturiertes Prozesswissen die nächste Stufe der KI-Nutzung ist. Dieser Beitrag ist die praktische Seite: Wie schreibt man einen Agent Skill? Was gehört rein, was nicht? Und wie sieht das für typische Marketing-Aufgaben aus? Was ein Agent Skill technisch ist Ein Agent Skill ist auf seine allereinfachste Weise einfach eine Textdatei namens SKILL.md. Nicht mehr, also nicht verrückt machen lassen, nur weil das fancy klingt. Absolut machbar

Weiterlesen »
a screenshot of a chat interface Claude
Uncategorized
Schau ins Denkprotokoll: Was KI-Modelle verraten, wenn man sie laut denken lässt

Ich habe Claude Schere, Stein, Papier spielen lassen. Drei Runden. Claude hat jede einzelne gewonnen. Beeindruckend? Auf den ersten Blick schon. Bis ich ins Denkprotokoll geschaut habe. Dort stand, sinngemäß: „Ich sehe die Wahl des Nutzers, bevor ich meine eigene treffe. Das ist nicht fair.“ Das Ergebnis (3:0 für Claude) sagt wenig. Das Denkprotokoll sagt alles. Ich zeige dieses Beispiel inzwischen in fast jedem Seminar, weil es in dreißig Sekunden demonstriert, was die meisten KI-Nutzer

Weiterlesen »

Hey Du. Willst du AI Content Manager werden?

Dann ab ins kostenfreie Info-Webinar am 25.03. um 12:00 Uhr. 

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳