Flux.1: Was kann das neue Bild-KI Model aus Deutschland?

Flux.1: Der neue Star am Bild-KI-Himmel?

Ein neuer Player mischt die Welt der KI-Bildgenerierung auf: Flux.1 von Black Forest Labs. Gerade erst angekündigt, sorgt das Tool bereits für Furore in der Kreativ- und Tech-Szene.

 

Das Versprechen? Nicht weniger als der neue Industriestandard für generative Medien zu werden. Ein gewagtes Ziel angesichts der Konkurrenz durch Midjourney, DALL-E und Co.

 

Aber hat Flux.1 wirklich das Zeug dazu? Kann es in Sachen Bildqualität und kreative Vielfalt mithalten oder sogar die Platzhirsche übertrumpfen?

 

In diesem Beitrag nehmen wir Flux.1 unter die Lupe, zeigen dir, wie du es selbst testen kannst und was bei der kommerziellen Nutzung zu beachten ist.

 

➡️ Was ist dran am Hype? Hat Flux.1 eine echte Chance gegen Midjourney? Die Antworten findest du in unserem großen Bild-KI Vergleich 2024.

 

PS: alle gezeigten Bilder im Beitrag wurden mit Flux.1 [dev] lokal generiert.

Inhaltsverzeichnis

Wer steckt hinter Flux.1? Das Black Forest Labs Team

Black Forest Labs ist kein Newcomer im klassischen Sinne. Hinter dem Unternehmen steht ein Team von KI-Experten, die du vielleicht schon kennst – wenn nicht namentlich, dann durch ihre Arbeit:

 

  • Sie waren maßgeblich an der Entwicklung von VQGAN, Latent Diffusion und den Stable Diffusion Modellen beteiligt.
  • Ihre Innovationen umfassen Stable Diffusion XL, Stable Video Diffusion und Rectified Flow Transformers.
  • Sie brachten uns Adversarial Diffusion Distillation für ultraschnelle Bildsynthese in Echtzeit.

 

Kurz gesagt: Wir haben es hier mit echten Schwergewichten der KI-Forschung zu tun.

Finanzierung und Unterstützung

Dass die Tech-Welt große Hoffnungen in Black Forest Labs setzt, zeigt sich an der beeindruckenden Finanzierung:

  • 31 Millionen Dollar in der Seed-Finanzierungsrunde
  • Hauptinvestor: Andreessen Horowitz
  • Weitere namhafte Investoren wie Brendan Iribe, Michael Ovitz und Garry Tan

 

Zusätzlich konnte Black Forest Labs einen hochkarätigen Beirat gewinnen, darunter Michael Ovitz (Erfahrung in der Content-Branche) und Prof. Matthias Bethge (Pionier des Neural Style Transfer).

 

Mit dieser Kombination aus Expertise, Finanzkraft und strategischer Unterstützung positioniert sich Black Forest Labs als ernstzunehmender Player im KI-Markt. Ob sie ihrem Anspruch, den Industriestandard neu zu definieren, gerecht werden können, bleibt spannend zu beobachten.

Die Flux.1 Modellfamilie im Überblick

Black Forest Labs startet nicht mit einem einzelnen Modell, sondern gleich mit einer ganzen Modellfamilie. Flux.1 kommt in drei Varianten, die unterschiedliche Anwendungsszenarien und Nutzergruppen bedienen:

Diese Aufstellung zeigt, dass Black Forest Labs verschiedene Nutzerbedürfnisse berücksichtigt – vom Hobby-Künstler bis zum Enterprise-Kunden. Besonders interessant für unsere Community dürfte Flux.1 [dev] sein, das hochwertige Ergebnisse bei einfachem Zugang verspricht.

Im nächsten Abschnitt werfen wir einen Blick unter die Haube und schauen uns an, was Flux.1 technologisch von anderen Modellen unterscheidet.

  1. Flux.1 [schnell]
    • Optimiert für lokale Entwicklung und persönlichen Gebrauch
    • Schnellstes Modell der Familie
    • Open Source unter Apache 2.0 Lizenz
    • Verfügbar auf HuggingFace, GitHub und in HuggingFace’s Diffusers

Flux.1 [dev]
• Open-Weight-Modell für nicht-kommerzielle Anwendungen
• Direkt von Flux.1 [pro] abgeleitet, mit ähnlicher Qualität
• Effizienter als Standardmodelle gleicher Größe
• Frei verfügbar auf HuggingFace, Replicate und Fal.ai

Flux.1 [pro]
• Das Flaggschiff-Modell mit Spitzenleistung in Bildgenerierung
• Herausragende Prompt-Befolgung, visuelle Qualität und Detailgrad
• Zugänglich über API, Replicate und fal.ai
• Maßgeschneiderte Enterprise-Lösungen verfügbar

Diese Aufstellung zeigt, dass Black Forest Labs verschiedene Nutzerbedürfnisse berücksichtigt – vom Hobby-Künstler bis zum Enterprise-Kunden. Besonders interessant für unsere Community dürfte Flux.1 [dev] sein, das hochwertige Ergebnisse bei einfachem Zugang verspricht.

Im nächsten Abschnitt werfen wir einen Blick unter die Haube und schauen uns an, was Flux.1 technologisch von anderen Modellen unterscheidet.

Technologie hinter Flux.1: Was macht es besonders?

Flux.1 ist nicht einfach nur ein weiteres Diffusionsmodell. Black Forest Labs hat hier einige interessante technologische Innovationen eingebaut:

 

  1. Hybride Architektur
    • Kombination aus multimodalen und parallelen Diffusions-Transformer-Blöcken
    • Skaliert auf beeindruckende 12 Milliarden Parameter

  2. Flow Matching
    • Basiert auf einer allgemeinen und konzeptionell einfachen Methode zum Training generativer Modelle
    • Diffusion ist hier nur ein Spezialfall – Flux.1 geht darüber hinaus

  3. Verbesserte Hardware-Effizienz
    • Einsatz von rotierenden Positionseinbettungen (rotary positional embeddings)
    • Verwendung paralleler Attention-Layer

  4. Breite Unterstützung verschiedener Seitenverhältnisse
    • Flexibel für Ausgaben zwischen 0,1 und 2,0 Megapixel
    • Ideal für verschiedene Anwendungsfälle im Marketing und Design

 

Diese technischen Besonderheiten versprechen nicht nur eine Verbesserung der Bildqualität und Prompt-Treue, sondern auch eine erhöhte Effizienz und Vielseitigkeit.

 

Black Forest Labs hat angekündigt, in naher Zukunft einen detaillierten technischen Bericht zu veröffentlichen. Wir werden euch auf dem Laufenden halten, sobald dieser verfügbar ist.

 

Was diese technischen Innovationen in der Praxis bedeuten? Das schauen wir uns im nächsten Abschnitt an, wo wir Flux.1 auf Herz und Nieren geprüft haben.

Flux.1 im Praxistest: Hält es, was es verspricht?

Die Ankündigung klingt vielversprechend, aber wie schlägt sich Flux.1 im direkten Vergleich mit den etablierten Größen? Wir haben es ausgiebig getestet und mit Midjourney, DALL-E 3, Adobe Firefly und Stable Diffusion verglichen.

 

Die detaillierten Ergebnisse findest du in unserem großen Bild-KI Vergleich 2024.

Hier schon mal ein Appetithappen:

Besondere Stärken:

  • Packagingdesign
  • Interiordesign
  • Sehr gute Textwiedergabe

Kleinere Schwächen bei Detailaspekten und Look & Feel oft zu weich/kindlich

• Im Vergleich:

  • Midjourney 6.1 noch vorne bei Detailgenauigkeit und komplexen Prompts
  • Flux.1 etabliert sich als ernstzunehmender Konkurrent

• Vorteile als Open-Source-Lösung:

  • Maximale Flexibilität für Nutzer
  • Gute Integration in bestehende Workflows
  • Anpassungsmöglichkeiten

 

Persönliche Beobachtungen:

  1. Flux.1 neigt eher zu gefälligem, süßem und glattgebügeltem Output, wenn der Prompt genug Spielraum lässt. Gerade für realistische Fotos braucht es also ausführliche Prompts wie noch zu Stable Diffusion 1.5 Zeiten. Beschreibt alles exakt, von Hauttextur über Hintergrund, Atmosphäre uvm. 
  2. Alter: Ich nutze gerne Altersangaben wie „40 year old woman“ in meinen Prompts für direkten Kontext. Diese Angaben führen tendenziell aber zu zu alten Menschen. Ein „40 year old man“ wirkt eher wie 50 oder 60+.
  3. Textwiedergabe: Funktioniert auf Englisch deutlich besser als auf deutsch. „Lokal generiert mit Flux“ konnte ich nicht fehlerfrei generieren „generated locally with flux“ schon.

 

Alle Details, Bildbeispiele und unsere ausführliche Analyse findest du in unserem Vergleichstest.

Neugierig geworden? Im nächsten Abschnitt zeigen wir dir, wie du Flux.1 selbst ausprobieren kannst.

So kannst du Flux.1 jetzt ausprobieren

Hey, du willst Flux.1 selbst testen? Wir zeigen dir, wie’s geht! Du hast mehrere Möglichkeiten:

 

Webtools für den schnellen Start:

  • Replicate: Perfekt für den einfachen Einstieg. Hier kannst du Flux.1 direkt im Browser ausprobieren, ohne Installation.

  • fal.ai: Noch eine tolle Option für’s Online-Testen. Ideal, wenn du Flux.1 schnell und unkompliziert ausprobieren möchtest.

 

Diese Webtools sind super, um einen ersten Eindruck zu bekommen. Aber für volle Kontrolle und Anpassungsmöglichkeiten empfehlen wir die lokale Installation:

Lokale Generierung mit ComfyUI

Aktuell läuft Flux.1 lokal am besten über ComfyUI. Hier die Schritte:

  1. Hardware-Check: Du brauchst mindestens 24GB VRAM und 32GB RAM. Kein Leichtgewicht, aber für KI-Enthusiasten machbar!

  2. ComfyUI updaten: Stell sicher, dass du die neueste Version hast.

  3. Text-Encoder besorgen:

  4. VAE installieren:

  5. Flux1-schnell installieren:

  6. Workflow einrichten:


Fun Fact: Die „schnell“-Version von Flux.1 bietet dir 1 bis 4 Schritte und kommt mit einer Apache 2.0 Lizenz. Perfect für schnelles Experimentieren!

Kommerzielle Nutzungsrechte von Flux.1

Hey, aufgepasst! Bei Flux.1 gibt’s in Sachen Nutzungsrechte einiges Spannendes:

• Flux.1 [schnell]: Der Allrounder mit Freiheiten

  • Apache 2.0 Lizenz: Volle kommerzielle Nutzung erlaubt
  • Perfekt für lokale Entwicklung und persönlichen Gebrauch
  • Offen verfügbar auf Hugging Face und mit ComfyUI-Integration

• Flux.1 [dev]: Der Open-Weight-Champion für Experimentierfreudige

  • Freie Nutzung für nicht-kommerzielle Anwendungen
  • Ähnliche Qualität wie [pro], aber effizienter
  • Für kommerzielle Nutzung: Kontakt via flux@blackforestlabs.ai

• Flux.1 [pro]: Das Powerhouse für Profis

  • Topnotch Performance für State-of-the-Art Bildgenerierung
  • Verfügbar über API, Replicate und fal.ai
  • Enterprise-Lösungen auf Anfrage
  • Für kommerzielle Nutzung freigegeben

 

Unser Tipp: Mit [schnell] kannst du sofort loslegen – auch kommerziell. Perfekt zum Experimentieren und für kleinere Projekte. Für größere kommerzielle Vorhaben lohnt sich ein Blick auf [pro] oder eine Anfrage für maßgeschneiderte Lösungen.

Denk dran: Die KI-Welt dreht sich schnell. Behalte die Entwicklungen im Auge und wähle das Flux.1-Modell, das am besten zu deinen Projekten und deinem Budget passt. Egal ob du mit [schnell] startest oder gleich auf [pro] setzt – mit Flux.1 bist du für innovative Bildgenerierung gerüstet!

Du willst den KI-Hype nicht nur verstehen, sondern auch für dein Marketing nutzen? Dann ist das KI Marketing Bootcamp genau das Richtige für dich!

In nur 8 Stunden, verteilt auf drei Wochen, lernst du von den erfahrenen KI-Experten Vroni Hackl und Georg Neumann alles, was du brauchst, um generative KI strategisch und effizient einzusetzen. Egal ob Textgenerierung mit GPT-4, Bildkreation mit Stable Diffusion oder fortgeschrittene Anwendungen – im Bootcamp erhältst du das nötige Hintergrundwissen und praktische Skills für deinen Marketing-Alltag.

 

Keine Luftschlösser, sondern handfeste Strategien und Workflows stehen im Fokus. Sichere dir jetzt deinen Wettbewerbsvorsprung und melde dich noch heute an!

Das könnte Dich auch interessieren:

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳