Stable Diffusion SDXL 1.0 – Gamechanger oder Gurke?

Der Fortschritt in der Welt der Künstlichen Intelligenz (KI) ist atemberaubend und bietet stetig neue Möglichkeiten. Am 26. Juli 2023 wurde SDXL 1.0 als neues Basis-Model von Stable Diffusion veröffentlicht. Wir haben uns die Zeit genommen, das neue Bildgenerierungs-Model ausgiebig auszuprobieren. Soviel vorweg: Definitiv Gamechanger! Hier teilen wir unsere Eindrücke:

 

1. Handhabung und Integration

Leider ist die Handhabung von SDXL 1.0 momentan noch etwas holprig. Die Integration in Automatic1111 könnte noch etwas Feinschliff gebrauchen. Für diejenigen, die eine alternative Route wählen möchten, steht das node-basierte ComfyUI zur Verfügung. Hierbei handelt es sich jedoch um ein eher komplexes Interface, welches Anfänger vielleicht abschrecken könnte.

 

 

2. Bildqualität

Das Herzstück eines jeden Bildgenerierungs-Models. Und hier punktet SDXL 1.0 gewaltig! Die Bildqualität ist phänomenal. Selbst ohne feines Tuning liefert das Modell bereits mit einfachen Prompts brillante Ergebnisse. Ein besonderes Highlight ist die feste Integration von Offset Noise im Training, wodurch Bilder entstehen, die in Sachen Kontrast mit denen des Konkurrenten Midjourney mithalten können.

 

 

3. Prompting

Ein wesentlicher Vorteil des neuen SDXL 1.0 ist das verbesserte Textverständnis. Dies spart nicht nur Zeit, sondern auch Nerven. Besonders hervorzuheben ist, dass die Tage der langen, umständlichen negativen Prompts aus Stable Diffusion 1.5 Zeiten gezählt sind. Nun kann man sich wirklich auf das Wesentliche konzentrieren, was den Prozess erheblich beschleunigt.

 

SDXL 1.0 Testreihe mit negative Prompt:

SDXL 1.0 Testreihe ohne negative Prompt:

Prompt: medium shot photo of a happy 40 year old business woman with ginger hair, freckles, munich, beautiful detailed face, dramatic lighting, 50mm, F1.8, film grain, chromatic aberations, analog photography


Negative: animation,doll,anime,painting,cartoon,drawing,illustration,3d,sketch,surreal,(cropped head), (cropped body),out of frame,crossed eyes, bad hands,((disfigured)),((deformed)),strange anatomy,(bad proportions),((extra limbs)),(ugly),((b&w)),weird colors,blurry,((monochrome)),lowres,(low quality:2),jpeg artifacts

 

4. Training

Einfach beeindruckend! Wir haben den ultimativen Test gemacht: Georg Neumann hat basierend auf 109 Fotos ein eigenes SDXL 1.0 Model trainiert. Ohne aufwändiges Captioning oder sorgfältige Bildauswahl entstand in nur 10.000 Steps ein hochwertiges Modell.

 

Trainingsdaten:

 

 

Testgenerierungen

 

 

Georgs Reaktion?

„Wow! Wenn das nur der Anfang ist, bin ich gespannt, wo wir in ein paar Monaten sein werden, besonders wenn wir mit bereits feingetunten Models aus der Community arbeiten können.“

 

Unser Fazit zu SDXL 1.0

Die Zeichen stehen auf Innovation. SDXL 1.0 ist nicht einfach nur ein neues Update – es markiert einen bedeutenden Schritt nach vorne. Dies spiegelt sich auch in der begeisterten Aufnahme durch die Open-Source-Community wider. Sogar eingefleischte Fans von Stable Diffusion 1.5 erkennen das Potential und wechseln bereits. Mit den ständig erscheinenden, hochwertigen Embeddings und feingetunten Models steht der KI-Bildgenerierung eine strahlende Zukunft bevor.

Wer hat's geschrieben?

Das könnte Dich auch interessieren:
Minimalistische, quadratische Infografik mit dem Haupttitel "EVOLUTION: PROMPT -> CONTEXT -> SKILLS ENGINEERING". Darunter befinden sich drei farblich kodierte, rechteckige Felder, die durch Pfeile von links nach rechts verbunden sind und einen Entwicklungsprozess darstellen. Das linke, hellblaue Feld ist betitelt mit "PROMPT ENGINEERING". Es enthält eine Ikone einer Gedankenblase mit einem Fragezeichen und einer Lupe über Text. Text darunter: "FOCUS: Single Input", "QUESTION: 'How do I formulate my instruction?'", "GOAL: Perfect the prompt". Ein Pfeil zeigt auf das mittlere, hellorange Feld mit dem Titel "CONTEXT ENGINEERING". Die Ikone zeigt Dokumente, eine Cloud-Datenbank und Zahnräder. Text darunter: "FOCUS: Information", "QUESTION: 'What information does the AI need?'", "GOAL: Provide background data". Ein weiterer Pfeil zeigt auf das rechte, hellgrüne Feld mit dem Titel "SKILLS ENGINEERING". Die Ikone zeigt ein Flussdiagramm mit Entscheidungsknoten und einem abgehakten Kontrollkästchen. Text darunter: "FOCUS: Process Knowledge", "QUESTION: 'What process knowledge does the AI need?'", "GOAL: Optimize action competence". Am unteren Rand der Grafik fasst eine Zeile das Ergebnis der Evolution zusammen: "OPTIMIZES: Single Interactions -> Knowledge State -> Action Competence".
KI im Einsatz
Skills Engineering: Ist das was Neues oder die Weiterentwicklung von Prompt- und Context Engineering?

Nach Prompt Engineering kam Context Engineering. Jetzt zeichnet sich ab, was als Nächstes kommt: Skills Engineering. Ich rechne damit, dass der Begriff in den kommenden Monaten zunehmend auftaucht. Denn die Entwicklung dahin, was damit gemeint ist, ist sinnvoll und konsequent, wenn man bessere Ergebnisse mit KI erzielen will. Was ist Skills Engineering? „Skills Engineering beschreibt die Kompetenz, menschliches Prozesswissen so aufzubereiten, dass KI-Agenten es nutzen können.“ (Vroni) Das klingt abstrakt, meint aber etwas sehr Konkretes.

Weiterlesen »
Aktuelles
Nano Banana 2: Pro-Qualität zum Flash-Preis?

Google hat letzte Woche Nano Banana 2 veröffentlicht, technisch das Modell Gemini 3.1 Flash Image. Es ersetzt Nano Banana Pro als Standard in der Gemini-App und soll Pro-Level-Qualität bei deutlich höherer Geschwindigkeit und rund halbem Preis liefern. Ich hab’s direkt gegen Pro antreten lassen. Mein erster Eindruck: Nano Banana 2 ist verdammt nah dran. Aber vor allem ist es schnell. Geschwindigkeit als echter Hebel Während man bei Pro teilweise Minuten auf ein einzelnes Bild warten

Weiterlesen »
Aktuelles
Die neue Knappheit: Warum mehr Content weniger wert ist

Content kostet fast nichts mehr. Ein Blogpost? Fünf Minuten mit Claude. Zehn Social-Media-Varianten? Noch mal drei Minuten. Ein kompletter Redaktionsplan für sechs Monate? Eine Stunde, wenn man gründlich ist. Die Produktionskosten sind auf nahezu Null gefallen. Und genau deshalb ist die meiste Content-Strategie, die ich sehe, gerade dabei, wertlos zu werden. Das klingt paradox. Aber die Ökonomie ist eindeutig: Wenn etwas im Überfluss existiert, verliert es seinen Wert. Was knapp bleibt, wird kostbar. Content ist

Weiterlesen »
KI News
Dein KI-Anbieter wurde gerade zum Sicherheitsrisiko erklärt. Was jetzt?

Am Freitag hat die US-Regierung Anthropic auf eine Stufe mit Huawei gestellt. Nicht wegen Spionage, nicht wegen Verbindungen zu feindlichen Staaten, sondern weil das Unternehmen sich weigerte, zwei Sicherheitsleitplanken aus einem Pentagon-Vertrag zu entfernen: keine Massenüberwachung von US-Bürgern, keine vollständig autonomen Waffensysteme. Wenige Stunden später verkündete OpenAI, den frei gewordenen Platz übernommen zu haben. CEO Sam Altman behauptete, sein Deal enthalte dieselben Sicherheitsprinzipien. Aber wer genau hinschaut, sieht: OpenAI hat den entscheidenden Kompromiss gemacht, den

Weiterlesen »
Ein Detailfoto, das eine Hand eines Geschäftsmannes im Anzug zeigt, die aus einer Spraydose mit dem Etikett „AI WASHING“ einen cyanfarbenen Dunst auf eine rissige Betonwand sprüht. Die Spraydose ist eine silberne Metalldose mit einem goldfarbenen Etikett und einem schwarzen Sprühkopf, die er mit Daumen und Zeigefinger hält. An seiner Hand trägt er einen goldenen Ehering und eine goldene Armbanduhr mit einem hellen Zifferblatt, die am Handgelenk sichtbar ist. Auf der rissigen Betonwand sind links einige Wörter eingeritzt, darunter „DOWNSIZING“, „LAYOFFS“, „DOWNSIZING“, „BUDGET“ und „AUSTERITY“, die alle grau und schwer lesbar sind. Der cyanfarbene Dunst, der aus der Spraydose sprüht, bildet auf der Wand eine leuchtend cyanfarbene, digitale Oberfläche mit Schaltkreisen, Icons und leuchtenden Wörtern. Oben links auf dieser Oberfläche steht „AI INNOVATION“, darunter „FUTURE EFFICIENCY“ und ganz unten „AUTOMATION“. Der Geschäftsmann steht rechts und sprüht den Dunst auf die linke Seite der Wand, wodurch die graue Wand mit den negativen Wörtern übermalt wird. Der Hintergrund ist ein unscharfer, dunkler Büroraum mit einigen Schreibtischen und Lampen. Die Betonwand ist links rissig und uneben, rechts wird sie durch die digitale, leuchtende Oberfläche glatt und modern.
Aktuelles
AI-Washing: Wenn „KI-Transformation“ Entlassungen bedeutet

Block, das Unternehmen hinter Square und Cash App, hat gestern 4.000 Menschen entlassen, das entspricht 40 Prozent der Belegschaft. CEO Jack Dorsey nennt es eine strategische Entscheidung für die KI-Zukunft. Für die Betroffenen klingt „intelligence-native company“ vermutlich anders als für die Investoren, die den Kurs nach oben trieben. Und für alle, die sich fragen, was KI tatsächlich mit Arbeitsplätzen macht, lohnt sich ein genauerer Blick – auf die Zahlen, die Narrative und die Forschung dahinter.

Weiterlesen »
KI im Einsatz
Der Bullshit Benchmark: Was passiert, wenn KI-Modelle auf Unsinn hereinfallen

55 Fragen, jede einzelne davon Unsinn. Und die meisten Sprachmodelle haben brav geantwortet, als wäre alles völlig plausibel. Peter Gostev, AI Capability Lead bei Arena, hat mit seinem „Bullshit Benchmark“ etwas sichtbar gemacht, das ich seit 2022 in jeder Schulung predige: Die gefährlichste Eigenschaft von Sprachmodellen ist nicht, dass sie Fehler machen. Es ist, dass sie Fehler machen, die sich richtig anfühlen. Was der Bullshit Benchmark testet Die Idee ist so simpel wie entlarvend: Gostev

Weiterlesen »

Hey Kreativer. Willst du AI Art Director werden? 🎨

Dann ab ins kostenfreie Info-Webinar am 19.03. um 12:00 Uhr. 

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳