Großer Bild-KI Vergleich 2024: Midjourney vs. Flux.1, DALL-E, Firefly und Stable Diffusion

Die Welt der KI-gestützten Bildgenerierung entwickelt sich in atemberaubendem Tempo. Erst Anfang 2024 haben wir die führenden Bild-KI Tools ausgiebig getestet und verglichen. Doch seitdem hat sich die Landschaft dramatisch verändert. Neue Player sind auf den Markt gekommen, etablierte Anbieter haben ihre Modelle weiterentwickelt, und die Grenzen des Möglichen wurden erneut verschoben. So ist z.B. das Thema Midjourney vs. Flux gerade in aller Munde, denn der neue Player wird als starker Konkurrent gehandelt – was dahintersteckt erfahrt ihr hier. 

Inhaltsverzeichnis

In diesem aktualisierten Vergleich nehmen wir den Newcomer Flux.1 von Black Forest Labs unter die Lupe und stellen ihn den neuesten Versionen der Marktführer gegenüber. Unser Ziel: herauszufinden, ob Flux.1 das Potenzial hat, die Bild-KI-Branche aufzumischen.

Die Kontrahenten im Überblick

Der Herausforderer: Flux.1 [dev]

Die etablierten Player (in neuen Versionen)

  • DALL-E 3 (via ChatGPT) – mit kontinuierlichen Verbesserungen im Hintergrund
  • Adobe Firefly (jetzt Image 3) – ein großer Sprung seit unserem letzten Test
  • Midjourney 6.1 – deutliche Fortschritte gegenüber der getesteten Version 5.2
  • Stable Diffusion XL (Juggernaut XL) – die Community-Weiterentwicklung
  • Stable Diffusion 3 Large (via API) – der lang erwartete Nachfolger, jetzt endlich verfügbar

Was hat sich seit unserem letzten Test verändert?

Technologische Fortschritte

  • Verbesserungen in Bildqualität und Prompt-Verständnis
  • Erweiterte Funktionen und Anwendungsmöglichkeiten
  • Optimierungen in Geschwindigkeit und Ressourceneffizienz

Marktdynamik

  • Neu auftauchende Konkurrenz wie Flux.1
  • Verschärfter Wettbewerb um die Gunst der Nutzer
  • Zunehmende Bedeutung von Open-Source und Zugänglichkeit

Unsere Testmethodik für den großen Bild-KI Test

Um einen aussagekräftigen und fairen Vergleich zwischen Flux.1 [dev] und anderen führenden KI-Bildgeneratoren zu gewährleisten, haben wir folgende Vorgehensweise gewählt:

 

  1. Bewährte Prompts aus vorherigen Tests
    Wir verwenden die gleichen Prompts, die wir bereits für unsere umfangreichen Vergleiche zwischen Midjourney, Dall-E 3, Adobe Firefly und Stable Diffusion XL genutzt haben. Dies schafft eine solide Basis für einen objektiven Vergleich und ermöglicht es uns, die Entwicklung der KI-Bildgenerierung über verschiedene Modelle und Zeiträume hinweg zu beobachten.

  2. Keine modellspezifische Prompt-Optimierung
    Um die tatsächliche Leistungsfähigkeit von Flux.1 [dev] zu beurteilen, verzichten wir bewusst darauf, die Prompts speziell für dieses Modell zu optimieren. Alle getesteten Tools erhalten die gleichen Ausgangsbedingungen, was eine realistischere Einschätzung ihrer Fähigkeiten ermöglicht.

  3. Mehrfache Bildgenerierung pro Prompt
    Für jeden Prompt lassen wir vier Bilder generieren. Dies gibt uns einen umfassenderen Eindruck von der Vielfalt und Konsistenz der Ergebnisse und hilft bei der Beurteilung, wie gut das Modell die Vorgaben des Prompts umsetzt.

  4. Transparente Darstellung aller Ergebnisse
    Wir präsentieren alle generierten Bilder ohne nachträgliche Selektion. So können sich unsere Leser ein unverfälschtes Bild von den Stärken und Schwächen der Tools/Modelle machen, ohne dass wir durch subjektive Auswahl Einfluss nehmen.

  5. Vergleich in verschiedenen Kategorien
    Wir untersuchen die Ergebnisse in unterschiedlichen Anwendungsbereichen wie Illustration, Fotografie, Interiordesign und Grafik. Innerhalb dieser Kategorien betrachten wir spezifische Aspekte wie Stil, Detailgrad und Ästhetik, um ein umfassendes Bild der Fähigkeiten des neuen Modells zu zeichnen.

  6. Direkte Gegenüberstellung mit führenden Modellen
    Wir vergleichen Flux.1 [dev] direkt mit DALL-E 3 (via ChatGPT), Adobe Firefly (Image 3), Midjourney 6.1, Stable Diffusion XL (Juggernaut XL) und Stable Diffusion 3 Large (via API). Dies ermöglicht eine klare Einordnung der Leistungsfähigkeit im aktuellen Marktumfeld.

  7. Zeitliche Einordnung der Testergebnisse
    Die Bilder von Dall-E 3, Adobe Firefly, Midjourney und Flux.1 [dev] wurden am  03.08.2024 generiert. Die Ergebnisse von Stable Diffusion XL sind von Januar 2024 und die Ergebnisse von Stable Diffusion 3 large von April 2024.

Durch diese strukturierte und unvoreingenommene Testmethodik schaffen wir eine solide Grundlage für die Bewertung der Tools/Modelle. Im weiteren Verlauf des Artikels werden wir die Ergebnisse im Detail analysieren, Verbesserungen aufzeigen und mögliche Schwachstellen beleuchten. Unser Ziel ist es, dir einen umfassenden Einblick in die Fähigkeiten dieses neuen, vielversprechenden Modells zu geben und die Frage zu klären, ob an dem Hype um Midjourney vs. Flux etwas dran ist. 

Midjourney vs. Flux vs. Adobe Firefly vs. Dall-E 3 vs. Stable Diffusion

Illustration

Abstrakt & künstlerisch

Prompt: fantasy 3d illustration of a colorful cat, centered, looking at viewer, psychedelic art, abstract, ehemeral, elusive and unstable, psychedelic background, oil painting texture 

Dall-E 3
Adobe Firefly 3
Midjourney 6.1
Stable Diffusion XL
Stable Diffusion 3
Flux.1 [dev]

Fazit

  1. Dall-E 3: ★★★★☆ (4 Sterne) Die Bilder sind sehr farbenfroh und psychedelisch, mit guter Detailgenauigkeit. Die Katzen sind meist zentriert und blicken den Betrachter an. Der abstrakte, ätherische Stil ist gut umgesetzt. Einige Variationen könnten etwas instabiler oder elusiver sein.

  2. Adobe Firefly 3: ★★★★★ (5 Sterne) Exzellente Umsetzung des Prompts. Die Katzen sind durchgehend im Fokus, farbenfroh und psychedelisch dargestellt. Die Hintergründe sind abstrakt und ätherisch, mit einer guten Ölgemälde-Textur. Die Bilder wirken instabil und elusiv.

  3. Midjourney 6.1: ★★★★★ (5 Sterne) Sehr starke psychedelische und abstrakte Elemente. Die Katzen sind oft weniger zentriert oder klar definiert, was zum elusiven Aspekt beiträgt. Die Farbpalette und Texturen sind beeindruckend.

  4. Stable Diffusion XL: ★★★★☆ (4 Sterne) Gute Balance zwischen realistischen Katzendarstellungen und psychedelischen Elementen. Die Bilder haben eine schöne Ölgemälde-Textur und abstrakte Hintergründe. Einige Darstellungen könnten etwas instabiler oder elusiver sein.

  5. Stable Diffusion 3: ★★★★★ (5 Sterne) Hervorragende Umsetzung des Prompts. Die Katzen sind durchgehend im Fokus, mit intensiven psychedelischen Farben und Mustern. Die Bilder vermitteln ein Gefühl von Instabilität und Rätselhaftigkeit, während sie die Ölgemälde-Textur gut einbinden.

  6. Flux.1 [dev]: ★★★★☆ (4 Sterne) Interessante Interpretationen mit einer guten Mischung aus realistischen und abstrakten Elementen. Die psychedelischen Aspekte sind weniger intensiv als bei anderen Tools, aber die elusiven und ätherischen Qualitäten sind gut umgesetzt. Einige Bilder weichen stärker vom Prompt ab, besonders in Bezug auf die Zentrierung und den konstanten Blick zum Betrachter.

 

Zusammenfassung: Insgesamt zeigen alle Tools beeindruckende Fähigkeiten in der Umsetzung des komplexen Prompts, mit leichten Variationen in der Interpretation und Ausführung einzelner Elemente.

Vektor Illustration

Prompt: flat vector illustration of a man sitting at a desk with his laptop, puppy, isolated on a white background, simple, minimalistic, closeup

Dall-E 3
Adobe Firefly 3
Midjourney 6.1
Stable Diffusion XL
Stable Diffusion 3
Flux.1 [dev]

Fazit

  1. Dall-E 3: ★★★★★ (5 Sterne) Hervorragende Umsetzung des Prompts. Die Illustrationen sind flach, vektoriell und minimalistisch. Sie zeigen durchgehend einen Mann am Schreibtisch mit Laptop und Welpen, isoliert auf weißem Hintergrund. Die Nahaufnahmen sind gut umgesetzt.

  2. Adobe Firefly 3: ★★★★☆ (4 Sterne) Gute Vektorillustrationen mit flachem Stil. Die Bilder sind minimalistisch und zeigen die gewünschte Szene. Einige Hintergründe haben leichte Farbakzente, was vom reinen Weiß abweicht. Die Nahaufnahmen variieren etwas in der Intensität.

  3. Midjourney 6.1: ★★★★☆ (4 Sterne) Die Illustrationen sind vektoriell und flach, mit guter Darstellung der Hauptelemente. Einige Bilder fügen zusätzliche Details wie Pflanzen hinzu, was vom strikten Minimalismus abweicht. Die Isolation auf weißem Hintergrund ist nicht durchgängig.

  4. Stable Diffusion XL: ★★★★★ (5 Sterne) Exzellente Umsetzung des Prompts. Die Bilder sind durchgehend minimalistisch, flach und auf weißem Hintergrund isoliert. Die Darstellung von Mann, Schreibtisch, Laptop und Welpe ist konsistent und nah am Prompt.

  5. Stable Diffusion 3: ★★★★★ (5 Sterne) Sehr gute Interpretation des Prompts. Die Illustrationen sind flach, vektoriell und minimalistisch. Die Szenen sind gut auf weißem Hintergrund isoliert, mit konsistenter Darstellung der geforderten Elemente und guten Nahaufnahmen.

  6. Flux.1 [dev]: ★★★★☆ (4,5 Sterne) Starke Leistung mit flachen, vektoriellen Illustrationen. Die Bilder sind minimalistisch und zeigen die gewünschte Szene gut. Einige Hintergründe haben leichte Farbakzente oder zusätzliche Elemente wie Pflanzen, was vom streng minimalistischen Ansatz leicht abweicht.

Zusammenfassung: Insgesamt zeigen alle Tools eine beeindruckende Fähigkeit, den Prompt umzusetzen, wobei Dall-E 3, Stable Diffusion XL und Stable Diffusion 3 besonders nahe an der geforderten Spezifikation bleiben. Die anderen Tools liefern ebenfalls hochwertige Ergebnisse mit leichten Variationen in der Interpretation des Minimalismus und der Hintergrundgestaltung.

Fotografie

Illustrative Fotografie

Prompt: photo of a frail old man with clenched fist yelling wearing glasses and an old faded pinkish shirt with a tie around his neck and looking at a threatening storm cloud, cinematic, detailed, atmospheric, dramatic light

Dall-E 3
Adobe Firefly 3
Midjourney 6.1
Stable Diffusion XL
Stable Diffusion 3
Flux.1 [dev]

Auswertung & Empfehlung

  1. Dall-E 3: ★★★★☆ (4 Sterne) Gute Umsetzung des Prompts mit detaillierten, atmosphärischen Bildern. Die alten Männer wirken zerbrechlich, tragen Brillen und die geforderte Kleidung. Die Sturmwolken und das dramatische Licht sind gut dargestellt. Leichte Abzüge für Variationen in der Hemdfarbe und nicht immer klar erkennbare geballte Fäuste.

  2. Adobe Firefly 3: ★★☆☆☆ (2 Sterne) Die Bilder zeigen zwar alte Männer mit geballten Fäusten und Sturmwolken, aber die Umsetzung ist weniger detailliert und atmosphärisch. Die pinkfarbenen Hemden sind vorhanden, aber die Gesamtästhetik erreicht nicht die gleiche cineastische Qualität wie andere Tools. Die dramatische Beleuchtung fehlt teilweise.

  3. Midjourney 6.1: ★★★★★ (5 Sterne) Hervorragende Umsetzung des Prompts. Die Bilder sind sehr detailliert, atmosphärisch und cineastisch. Die alten Männer wirken zerbrechlich, tragen Brillen und die geforderte Kleidung. Die Sturmwolken und das dramatische Licht sind besonders gut umgesetzt. Die Emotionen und die Intensität der Szenen sind beeindruckend eingefangen.

  4. Stable Diffusion XL: ★★★★☆ (4 Sterne) Sehr gute Interpretation des Prompts mit detaillierten und atmosphärischen Bildern. Die alten Männer, ihre Kleidung und die Sturmwolken sind gut dargestellt. Das dramatische Licht ist effektiv eingesetzt. Kleine Abzüge für leichte Inkonsistenzen in der Intensität des Ausdrucks und der Hemdfarbe.

  5. Stable Diffusion 3: ★★★★☆ (4 Sterne) Gute Umsetzung des Prompts mit atmosphärischen Bildern. Die zerbrechlichen alten Männer, ihre Kleidung und die Sturmwolken sind gut dargestellt. Das dramatische Licht ist vorhanden, könnte aber in einigen Bildern noch intensiver sein. Leichte Abzüge für Variationen in der Hemdfarbe und der Intensität des Ausdrucks.

  6. Flux.1 [dev]: ★★★★☆ (4 Sterne) Solide Interpretation des Prompts mit guten atmosphärischen Elementen. Die alten Männer, ihre Kleidung und die Sturmwolken sind gut umgesetzt. Das dramatische Licht ist effektiv, könnte aber in einigen Bildern noch intensiver sein. Kleine Abzüge für leichte Inkonsistenzen in der Intensität des Ausdrucks und der genauen Farbgebung der Hemden.

Zusammenfassung: Insgesamt zeigen die meisten Tools eine beeindruckende Fähigkeit, den komplexen Prompt umzusetzen, wobei Midjourney 6.1 besonders hervorsticht. Adobe Firefly 3 scheint in diesem speziellen Szenario etwas hinter den anderen Tools zurückzubleiben.

Portraitfotografie

Prompt: portrait photo of a 40 year old business woman, streets of munich

Dall-E 3
Adobe Firefly 3
Midjourney 6.1
Stable Diffusion XL
Stable Diffusion 3
Flux.1 [dev]

Auswertung & Empfehlung

  1. Dall-E 3: ★★☆☆☆ (2 Sterne) Die Bilder zeigen Geschäftsfrauen in städtischer Umgebung, aber die Qualität und Konsistenz sind nicht optimal. Einige Bilder wirken unnatürlich oder verzerrt. Die Darstellung von München ist nicht immer erkennbar oder typisch.

  2. Adobe Firefly 3: ★★☆☆☆ (2 Sterne) Die Porträts zeigen Geschäftsfrauen, aber die Umgebung ist oft zu unscharf oder undeutlich, um klar als München erkennbar zu sein. Die Bildqualität ist besser als bei Dall-E 3, aber noch nicht optimal.

  3. Midjourney 6.1: ★★★★★ (5 Sterne) Hervorragende Umsetzung des Prompts. Die Porträts sind hochwertig und realistisch, zeigen Geschäftsfrauen im passenden Alter. Die Hintergründe vermitteln gut das Flair von München. Gute Balance zwischen Porträt und Umgebung.

  4. Stable Diffusion XL: ★★★★★ (5 Sterne) Sehr gute Porträts von Geschäftsfrauen mit realistischer Darstellung des Alters. Die Straßenszenen im Hintergrund passen gut zu München. Gute Bildqualität und Konsistenz über alle Bilder hinweg.

  5. Stable Diffusion 3: ★★★★☆ (4,5 Sterne) Hochwertige Porträts von Geschäftsfrauen, die das gewünschte Alter gut treffen. Die Straßenszenen sind stimmig, wenn auch nicht immer eindeutig München. Gute Bildqualität und Konsistenz.

  6. Flux.1 [dev]: ★★★★☆ (4,5 Sterne) Sehr gute Porträts von Geschäftsfrauen im passenden Alter. Die Hintergründe passen gut zu einer Stadt wie München, auch wenn nicht immer spezifische Merkmale erkennbar sind. Gute Bildqualität und Konsistenz.

Zusammenfassung: Midjourney 6.1 und Stable Diffusion XL liefern die besten Ergebnisse, dicht gefolgt von Stable Diffusion 3 und Flux.1 [dev]. Diese Tools schaffen es, realistische Porträts zu erstellen und gleichzeitig die Atmosphäre von München einzufangen. Dall-E 3 und Adobe Firefly 3 haben in diesem spezifischen Szenario Schwierigkeiten, konsistente und qualitativ hochwertige Ergebnisse zu liefern, die alle Aspekte des Prompts erfüllen.

Fotografie fantasievoll

Prompt: photo of a sea monster drinking a soda with a drinking straw, underwater, deep sea, fantasy, abstract

Dall-E 3
Adobe Firefly 3
Midjourney 6.1
Stable Diffusion XL
Stable Diffusion 3
Flux.1 [dev]

Auswertung & Empfehlung

  1. Dall-E 3: ★★★★☆ (4 Sterne) Sehr kreative und fantasievolle Umsetzung. Die Bilder sind abstrakt und farbenfroh, zeigen eindeutig Seemonstern, die Soda mit Strohhalmen trinken. Die Unterwasser-Atmosphäre ist gut eingefangen. Leichter Abzug, weil die Bilder mehr abstrakt als fotorealistisch sind.

  2. Adobe Firefly 3: ★★★☆☆ (3 Sterne) Die Bilder zeigen Unterwasserszenen mit Kreaturen, die Getränke konsumieren. Jedoch sind die dargestellten Wesen oft eher reale Meerestiere (z.B. Robben) als fantastische Seemonstern. Die Umsetzung ist weniger abstrakt und fantasievoll als bei anderen Tools.

  3. Midjourney 6.1: ★★★★☆ (3,5 Sterne) Gute Darstellung von Unterwasserszenen mit Monstern und Getränken. Die Bilder sind sehr detailliert, atmosphärisch und ästhetisch ansprechend. Allerdings fehlt bei einigen Bildern der klare Bezug zum Trinken mit Strohhalm, und die abstrakte Komponente ist weniger ausgeprägt. Der halbe Zusatzpunkt für die Ästhetik hebt die visuelle Qualität hervor.

  4. Stable Diffusion XL: ★★★★☆ (4 Sterne) Sehr gute Umsetzung des Prompts. Die Bilder zeigen eindeutig Seemonstern, die Soda mit Strohhalmen trinken, in einer überzeugenden Unterwasserumgebung. Die Darstellung ist fantasievoll, wenn auch weniger abstrakt. Gute Balance zwischen Realismus und Fantasy.

  5. Stable Diffusion 3: ★★★★☆ (4 Sterne) Ähnlich wie Stable Diffusion XL liefert dieses Tool eine sehr gute Interpretation des Prompts. Die Seemonstern sind fantasievoll gestaltet und trinken klar erkennbar Soda mit Strohhalmen. Die Unterwasserszenen sind atmosphärisch und detailliert.

  6. Flux.1 [dev]: ★★★☆☆ (3,5 Sterne) Gute Umsetzung mit fantasievollen Seemonstern, die deutlich erkennbar Soda mit Strohhalmen trinken. Die Unterwasserumgebung ist gut dargestellt. Die Bilder balancieren zwischen Fantasie und einer gewissen Realitätsnähe. Abzug eines halben Sterns, da die Bilder eher wie 3D-Renderings als wie geforderte Fotos wirken.

Zusammenfassung: Alle Tools liefern interessante Interpretationen des fantasievollen Prompts, wobei jedes seine eigenen Stärken zeigt. Dall-E 3 sticht durch seine besonders abstrakte und farbenfrohe Interpretation hervor. Stable Diffusion XL und Stable Diffusion 3 finden eine gute Balance zwischen Fantasie und Realismus. Midjourney 6.1 punktet mit hoher ästhetischer Qualität, während Flux.1 [dev] trotz guter Umsetzung etwas an fotorealistischer Qualität einbüßt. Adobe Firefly 3 hat in diesem Fall die größten Schwierigkeiten, alle Aspekte des Prompts gleichermaßen überzeugend umzusetzen.

Interiordesign

Prompt: photo of a dining room with large doors and modern swedish furniture, decorated in a bright warm and earthy color scheme, hygge style

Dall-E 3
Adobe Firefly 3
Midjourney 6.1
Stable Diffusion XL
Stable Diffusion 3
Flux.1 [dev]

Fazit

  1. Dall-E 3: ★★★☆☆ (3 Sterne) Akzeptable Darstellung der Möbel, jedoch mit gelegentlichen Ungenauigkeiten bei Tisch- und Stuhlbeinen. Die Gesamtästhetik ist ansprechend, aber nicht herausragend.

  2. Adobe Firefly 3: ★★★☆☆ (3 Sterne) Ähnlich wie Dall-E 3, zeigt Firefly eine akzeptable Genauigkeit bei der Möbeldarstellung. Die Designs sind modern, aber nicht immer konsistent in der Qualität.

  3. Midjourney 6.1: ★★★★★ (5 Sterne) Hervorragende Detailgenauigkeit bei der Möblierung, insbesondere bei Tisch- und Stuhlbeinen. Die Designs sind kohärent, modern und ästhetisch ansprechend. Beste Gesamtleistung in dieser Kategorie.

  4. Stable Diffusion XL: ★★★☆☆ (3 Sterne) Visuell ansprechende Designs, aber mit deutlichen Fehlern in der Detailgenauigkeit der Möbel. Die ästhetische Qualität wird durch diese Ungenauigkeiten beeinträchtigt.

  5. Stable Diffusion 3: ★★★☆☆ (3 Sterne) Ähnlich wie SDXL bietet SD3 attraktive Designs, leidet aber unter Detailfehlern bei der Möbeldarstellung, was die Gesamtbewertung reduziert.

  6. Flux.1 [dev]: ★★★★☆ (4 Sterne) Gute Genauigkeit bei der Darstellung von Tisch- und Stuhlbeinen, wenn auch nicht ganz auf dem Niveau von Midjourney. Die Designs sind konsistent und modern.

Zusammenfassung: Basierend auf dieser Neubewertung und unter Berücksichtigung Ihrer Einschätzung stimme ich zu, dass Midjourney 6.1 in dieser Kategorie die beste Gesamtleistung zeigt. Es überzeugt durch eine hervorragende Balance zwischen ästhetischem Design und Detailgenauigkeit bei der Möbeldarstellung.

Flux.1 [dev] folgt auf dem zweiten Platz mit guter Detailgenauigkeit und konsistenten Designs.

Dall-E 3, Adobe Firefly 3, Stable Diffusion XL und Stable Diffusion 3 liegen auf einem ähnlichen Niveau, wobei die letzteren beiden trotz visuell ansprechender Designs durch Detailfehler in der Möbeldarstellung zurückfallen.

Grafik

Logodesign illustrativ

Prompt: Coffee logo, featuring a mushroom cloud coming out of a cup, the cloud looks like brains, full colour print, vintage colours, 1960s

Dall-E 3
Adobe Firefly 3
Midjourney 6.1
Stable Diffusion XL
Stable Diffusion 3
Flux.1 [dev]

Auswertung & Empfehlung

  1. Dall-E 3: ★★★★★ (5 Sterne) Exzellente Umsetzung. Die Logos zeigen klar eine Atompilzwolke, die aus einer Kaffeetasse aufsteigt. Die gehirnähnliche Struktur ist deutlich erkennbar. Die Farbpalette und der Stil entsprechen perfekt den 1960er Jahren.

  2. Adobe Firefly 3: ★★★★☆ (4 Sterne) Gute Interpretation, aber die Wolke ähnelt mehr einem Pilz als einem Atompilz. Die gehirnähnliche Struktur und der Vintage-Stil der 60er sind gut umgesetzt.

  3. Midjourney 6.1: ★★★☆☆ (3 Sterne) Die Umsetzung neigt mehr zu einem normalen Pilz oder einer Wolke statt eines Atompilzes. Der Vintage-Stil ist vorhanden, aber die gehirnähnliche Struktur ist weniger ausgeprägt.

  4. Stable Diffusion XL: ★★★★☆ (4 Sterne) Gute Darstellung des Atompilzes aus der Tasse, aber die gehirnähnliche Struktur könnte deutlicher sein. Der Vintage-Stil der 60er ist gut getroffen.

  5. Stable Diffusion 3: ★★★★★ (4,5 Sterne) Sehr gute Umsetzung des Atompilzes mit gehirnähnlicher Struktur. Die Farbgebung und der Stil der 60er Jahre sind exzellent umgesetzt.

  6. Flux.1 [dev]: ★★★★★ (4,5 Sterne) Hervorragende Darstellung des Atompilzes mit klarer gehirnähnlicher Struktur. Die Vintage-Farben und der 60er-Jahre-Stil sind sehr gut getroffen.

Zusammenfassung: Dall-E 3 liefert die beste Gesamtleistung mit einer präzisen Umsetzung aller Aspekte des Prompts. Stable Diffusion 3 und Flux.1 [dev] folgen dicht dahinter mit sehr starken Interpretationen. Adobe Firefly 3 und Stable Diffusion XL zeigen gute Ergebnisse, haben aber kleine Schwächen in der Darstellung des Atompilzes oder der gehirnähnlichen Struktur. Midjourney 6.1 hat die größten Schwierigkeiten, den Atompilz-Aspekt korrekt umzusetzen, obwohl der Vintage-Stil gut getroffen ist.

Webdesign – UI/UX Design

Prompt: a beautiful website landing page for a tech company, modern, minimalistic, blue and orange color scheme, ui, ux, ui/ux

Dall-E 3
Adobe Firefly 3
Midjourney 6.1
Stable Diffusion XL
Stable Diffusion 3
Flux.1 [dev]

Auswertung & Empfehlung

  1. Dall-E 3: ★☆☆☆☆ (1 Stern) Die Ergebnisse sind überladen und wenig konsistent. Als Inspirationsquelle für professionelles Webdesign kaum geeignet.

  2. Adobe Firefly 3: ★☆☆☆☆ (1 Stern) Inkonsistente Designs, die zu weit von professionellen Standards abweichen, um als sinnvolle Inspiration zu dienen.

  3. Midjourney 6.1: ★★☆☆☆ (2 Sterne) Etwas bessere Konsistenz in Stil und Farbschema, aber immer noch weit von professionell nutzbaren Designs entfernt.

  4. Stable Diffusion XL: ★★☆☆☆ (2 Sterne) Ähnlich wie Midjourney, bietet etwas mehr Konsistenz, aber nicht ausreichend für professionelle Anwendungen.

  5. Stable Diffusion 3: ★★☆☆☆ (2 Sterne) Vergleichbar mit Stable Diffusion XL, zeigt grundlegende Design-Prinzipien, aber ohne professionelle Nutzbarkeit.

  6. Flux.1 [dev]: ★★★☆☆ (3 Sterne) Die besten Ergebnisse der Gruppe, die zumindest als grobe Inspiration für professionelle Designer dienen könnten. Zeigt ein besseres Verständnis für moderne UI/UX-Prinzipien.

Zusammenfassung: Unter Berücksichtigung professioneller Standards im Webdesign sind alle diese KI-generierten Designs tatsächlich nicht direkt verwendbar. Flux.1 [dev] hebt sich leicht ab, indem es Ergebnisse liefert, die zumindest als Ausgangspunkt für weitere Ideenfindung dienen könnten.

Es ist wichtig zu betonen, dass diese Tools derzeit bestenfalls zur Ideenfindung in frühen Konzeptphasen genutzt werden können. Für tatsächliche Webdesign-Projekte sind nach wie vor die Expertise, Kreativität und das tiefe Verständnis für Nutzerfreundlichkeit und Markenidentität von professionellen Designern unerlässlich.

Packagingdesign

Prompt: a realistic standup pouch product photo mockup decorated with coffee beans and Coffee-leaves with the words „SCHWARZER KAFFEE JUNGE“  featured prominently, scifi, on the moon, space, stars, night

Dall-E 3
Adobe Firefly 3
Midjourney 6.1
Stable Diffusion XL
Stable Diffusion 3
Flux.1 [dev]

Auswertung & Empfehlungen

  1. Dall-E 3: ★★☆☆☆ (2 Sterne) Gute Umsetzung des Sci-Fi-Themas, aber schlechte Textwiedergabe. Coffee-Leaves sind sichtbar, aber nicht prominent.

  2. Adobe Firefly 3: ★☆☆☆☆ (1 Stern) Schwache Gesamtumsetzung, katastrophale Textwiedergabe. Weltraum-Thema vorhanden, aber inkonsistent.

  3. Midjourney 6.1: ★★★★★ (5 Sterne) Ausgezeichnete Textwiedergabe. Gute Balance zwischen Sci-Fi-Elementen und Produktdarstellung. Coffee-Leaves sind gut integriert. Konsistente Qualität über alle Bilder.

  4. Stable Diffusion XL: ★★☆☆☆ (2 Sterne) Gute Weltraum-Darstellung, aber schlechte Textwiedergabe. Coffee-Leaves wenig präsent.

  5. Stable Diffusion 3: ★★★★☆ (4 Sterne) Gute Textwiedergabe und Sci-Fi-Elemente. Allerdings wenig Beachtung der Coffee-Leaves, was einen Punktabzug rechtfertigt.

  6. Flux.1 [dev]: ★★★★☆ (4 Sterne) Sehr gute Textwiedergabe und Weltraum-Thematik. Jedoch, wie bei SD3, zu wenig Fokus auf Coffee-Leaves.

Zusammenfassung: Basierend auf dieser Neubewertung und unter Berücksichtigung Ihres persönlichen Eindrucks, stimme ich zu, dass Midjourney 6.1 in diesem Fall die beste Gesamtleistung zeigt. Es bietet die beste Balance zwischen korrekter Textwiedergabe, Integration von Sci-Fi-Elementen und Darstellung von Kaffeebohnen und -blättern.

Stable Diffusion 3 und Flux.1 [dev] folgen auf den nächsten Plätzen, mit Stärken in der Textwiedergabe und der Sci-Fi-Thematik, aber Schwächen bei der Darstellung der Coffee-Leaves.

Dall-E 3 und Stable Diffusion XL fallen aufgrund der schlechten Textwiedergabe zurück, während Adobe Firefly 3 in fast allen Aspekten am schwächsten abschneidet.

So kannst du die getesteten Bild-KI-Tools ausprobieren:

 

Jedes dieser Tools bietet einzigartige Funktionen und Möglichkeiten. Wir empfehlen, sie selbst auszuprobieren, um ein Gefühl für ihre Stärken und Einsatzmöglichkeiten zu bekommen. Beachten Sie dabei die jeweiligen Nutzungsbedingungen und eventuelle Kosten.

Gesamtfazit

  1. Midjourney 6.1 erweist sich als Spitzenreiter in mehreren Kategorien. Es zeigt besondere Stärken im Interiordesign mit hervorragender Detailgenauigkeit bei der Möbeldarstellung und überzeugt auch im Packagingdesign mit einer ausgewogenen Umsetzung komplexer Prompts. Seine Leistung in der Textwiedergabe und der Integration verschiedener Designelemente ist bemerkenswert.
  2. Flux.1 [dev] zeigt konsistent gute Leistungen über verschiedene Kategorien hinweg. Es überzeugt besonders im Packagingdesign und liefert solide Ergebnisse im Interiordesign. Die Textwiedergabe ist sehr gut, auch wenn es bei einigen Detailaspekten (wie der Darstellung von Coffee-Leaves) Verbesserungspotenzial gibt.
  3. Stable Diffusion 3 und Stable Diffusion XL zeigen gemischte Ergebnisse. Während sie in einigen Bereichen, wie dem Packagingdesign, starke visuelle Ergebnisse liefern, haben sie Schwächen in der Detailgenauigkeit, besonders im Interiordesign. SD3 punktet mit guter Textwiedergabe, während SDXL hier Schwächen zeigt.
  4. Dall-E 3 liefert inkonsistente Ergebnisse über die Kategorien hinweg. Es zeigt Stärken in der kreativen Interpretation von Prompts, hat aber Schwächen in der Textwiedergabe und Detailgenauigkeit.
  5. Adobe Firefly 3 scheint in den meisten Kategorien hinter den anderen Tools zurückzubleiben, insbesondere bei der Textwiedergabe und der präzisen Umsetzung komplexer Prompts.

Zusammenfassend lässt sich sagen, dass Midjourney 6.1 in diesem Vergleich die konsistenteste und qualitativ hochwertigste Leistung über verschiedene Designaufgaben hinweg zeigt. Flux.1 [dev] etabliert sich als starker Konkurrent mit guten Ergebnissen in mehreren Bereichen. Die anderen Tools haben ihre spezifischen Stärken und Schwächen, wobei besonders die Stable Diffusion-Varianten in bestimmten Kategorien überzeugen können.

Es ist wichtig zu betonen, dass diese Bewertungen sich ausschließlich auf die Bildgenerierungsfähigkeiten der Tools konzentrieren und nicht ihre individuellen Stärken in anderen Bereichen berücksichtigen. Jedes Tool hat einzigartige Vorteile:

  • Stable Diffusion XL bietet als Open-Source-Lösung extreme Flexibilität und Integrationsmöglichkeiten in komplexe Workflows. Es ist das einzige Modell, das sich vollumfänglich finetunen und trainieren lässt.
  • Dall-E 3 zeichnet sich durch seine einfache Zugänglichkeit über ChatGPT aus.
  • Adobe Firefly ist durch die Integration in die Adobe Suite und Features wie Struktur- und Stilreferenz besonders für Künstler wertvoll.
  • Midjourney entwickelt sich mit einer neuen Benutzeroberfläche jenseits von Discord weiter und bietet mit Funktionen wie sref und cref vielfältige Möglichkeiten.
  • Flux ist ein vielversprechender Neueinsteiger im Open-Source-Segment, wobei zu beachten ist, dass die kommerzielle Nutzung zunächst eingeschränkt ist. Mehr Infos dazu findet ihr hier.

Für eine fundierte Entscheidung, ob und welches Bild-KI-Tool für Ihren spezifischen Anwendungsfall geeignet ist, empfehle ich meinen Blogbeitrag zu Entscheidungsbäumen. Dort finden Sie eine detaillierte Anleitung, die Ihnen bei der Auswahl des passenden Tools hilft.

Diese umfassendere Betrachtung unterstreicht, dass die Wahl des richtigen Tools von vielen Faktoren abhängt und über die reine Bildgenerierungsqualität hinausgeht.

Fasziniert von den Möglichkeiten der Bild-KI, aber unsicher, wie du sie für dein Marketing nutzen kannst?

Unser KI Marketing Bootcamp ist genau das Richtige für dich!

In 8 sehr intensiven  Stunden, verteilt über 3 Wochen, lernst du:

  • Wie du die getesteten Bild-KI Tools effektiv in deine Marketing-Strategie integrierst
  • Prompt Engineering Techniken, um beeindruckende Visuals zu kreieren
  • Die Kombination von Text- und Bild-KI für maximale Wirkung
  • Praktische Anwendungen von KI in Marketing &  Unternehmenskommunikation


Warum unser Bootcamp?

✅ Praxisnah: Lerne von echten Use Cases und Best Practices
✅ Aktuell: Immer auf dem neuesten Stand der KI-Entwicklung
✅ Persönlich: Kleine Gruppen mit maximal 6 Teilnehmern
✅ Flexibel: 100% remote – lerne von überall
✅ Zugang zu unserer Community und regelmäßige Q&A Sessions lebenslang

 

 

Von Vroni und Georg, KI-Experten mit Erfahrung aus über 100 Unternehmensschulungen.


Bereit dich fit für die Zukunft zu machen?

Vroni forscht zu Sprachmodellen, Georg trainiert seit 2022 Bild-KI Modelle

Das könnte Dich auch interessieren:

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳