Stable Diffusion SDXL 1.0 – Gamechanger oder Gurke?

Der Fortschritt in der Welt der Künstlichen Intelligenz (KI) ist atemberaubend und bietet stetig neue Möglichkeiten. Am 26. Juli 2023 wurde SDXL 1.0 als neues Basis-Model von Stable Diffusion veröffentlicht. Wir haben uns die Zeit genommen, das neue Bildgenerierungs-Model ausgiebig auszuprobieren. Soviel vorweg: Definitiv Gamechanger! Hier teilen wir unsere Eindrücke:

 

1. Handhabung und Integration

Leider ist die Handhabung von SDXL 1.0 momentan noch etwas holprig. Die Integration in Automatic1111 könnte noch etwas Feinschliff gebrauchen. Für diejenigen, die eine alternative Route wählen möchten, steht das node-basierte ComfyUI zur Verfügung. Hierbei handelt es sich jedoch um ein eher komplexes Interface, welches Anfänger vielleicht abschrecken könnte.

 

 

2. Bildqualität

Das Herzstück eines jeden Bildgenerierungs-Models. Und hier punktet SDXL 1.0 gewaltig! Die Bildqualität ist phänomenal. Selbst ohne feines Tuning liefert das Modell bereits mit einfachen Prompts brillante Ergebnisse. Ein besonderes Highlight ist die feste Integration von Offset Noise im Training, wodurch Bilder entstehen, die in Sachen Kontrast mit denen des Konkurrenten Midjourney mithalten können.

 

 

3. Prompting

Ein wesentlicher Vorteil des neuen SDXL 1.0 ist das verbesserte Textverständnis. Dies spart nicht nur Zeit, sondern auch Nerven. Besonders hervorzuheben ist, dass die Tage der langen, umständlichen negativen Prompts aus Stable Diffusion 1.5 Zeiten gezählt sind. Nun kann man sich wirklich auf das Wesentliche konzentrieren, was den Prozess erheblich beschleunigt.

 

SDXL 1.0 Testreihe mit negative Prompt:

SDXL 1.0 Testreihe ohne negative Prompt:

Prompt: medium shot photo of a happy 40 year old business woman with ginger hair, freckles, munich, beautiful detailed face, dramatic lighting, 50mm, F1.8, film grain, chromatic aberations, analog photography


Negative: animation,doll,anime,painting,cartoon,drawing,illustration,3d,sketch,surreal,(cropped head), (cropped body),out of frame,crossed eyes, bad hands,((disfigured)),((deformed)),strange anatomy,(bad proportions),((extra limbs)),(ugly),((b&w)),weird colors,blurry,((monochrome)),lowres,(low quality:2),jpeg artifacts

 

4. Training

Einfach beeindruckend! Wir haben den ultimativen Test gemacht: Georg Neumann hat basierend auf 109 Fotos ein eigenes SDXL 1.0 Model trainiert. Ohne aufwändiges Captioning oder sorgfältige Bildauswahl entstand in nur 10.000 Steps ein hochwertiges Modell.

 

Trainingsdaten:

 

 

Testgenerierungen

 

 

Georgs Reaktion?

„Wow! Wenn das nur der Anfang ist, bin ich gespannt, wo wir in ein paar Monaten sein werden, besonders wenn wir mit bereits feingetunten Models aus der Community arbeiten können.“

 

Unser Fazit zu SDXL 1.0

Die Zeichen stehen auf Innovation. SDXL 1.0 ist nicht einfach nur ein neues Update – es markiert einen bedeutenden Schritt nach vorne. Dies spiegelt sich auch in der begeisterten Aufnahme durch die Open-Source-Community wider. Sogar eingefleischte Fans von Stable Diffusion 1.5 erkennen das Potential und wechseln bereits. Mit den ständig erscheinenden, hochwertigen Embeddings und feingetunten Models steht der KI-Bildgenerierung eine strahlende Zukunft bevor.

Das könnte Dich auch interessieren:

Aktuelles

12 Days of OpenAI: Unsere Auswertung der ersten 7 Tage mit Sora, O1, ChatGPTpro, RFT, Canvas & Co.

Die KI-Welt erlebt gerade ihren ganz eigenen Adventskalender: OpenAI hat am 5. Dezember die „12 Days of OpenAI“ gestartet – eine beispiellose Innovations-Offensive, bei der das Unternehmen an zwölf aufeinanderfolgenden Werktagen neue Funktionen, Produkte und Demos vorstellt. Inhaltsverzeichnis Warum 12 Days of OpenAI? Diese Initiative kommt zu einem spannenden Zeitpunkt: Zwei Jahre nach der bahnbrechenden Einführung von ChatGPT zeigt OpenAI, dass sie weiterhin die Innovationsführerschaft im KI-Bereich beanspruchen. Die täglichen Livestreams mit Sam Altman &

Weiterlesen »
An AI Literacy Canvas displayed on a computer monitor. The canvas has a structured layout with eight distinct blocks, each containing text and icons. The blocks are organized in two rows with four columns each, featuring a mix of headings, descriptions, and visuals such as graphs, gears, robotic arms, and people interacting with AI concepts. The surrounding environment includes stylized books, charts, leaves, and gears in an orange, white, and gray color palette, symbolizing learning, innovation, and AI.
KI im Einsatz

AI Literacy Canvas: KI Kenntnisse gezielt entwickeln

Mit dem AI Literacy Canvas entwickelst du systematisch die KI-Kompetenzen, die dein Team wirklich braucht. Praxisnah, EU-AI Act-konform und sofort einsetzbar.   Denn 2024 war geprägt von KI-Schulungen und Personalentwicklung nach dem Gießkannen-Prinzip. 2025 kämpfen wir dafür, dass mehr Wert gelegt wird auf den Kontextbezug. Wie soll KI von wem überhaupt eingesetzt werden? Dazu haben wir ein Werkzeug vorbereitet:   Das AI Literacy Canvas wurde entwickelt, um KI Kenntnisse kontextbezogen zu vermitteln – das fordert

Weiterlesen »
KI im Einsatz

Stagniert die Entwicklung der Sprachmodelle? Ein Update für Marketer

OpenAI veröffentlicht grad feature um feature. Doch bei den Sprachmodellen, dem eigentlichen Kern des Ganzen, zeigt sich vergleichsweise wenig Entwicklung.   Während die großen Player am Markt ständig neue Features und Anwendungsmöglichkeiten präsentieren, scheinen die grundlegenden Fortschritte in der Modelltechnologie etwas langsamer zu werden. Ein subjektiver Eindruck, der einen genaueren Blick verdient. Inhaltsverzeichnis Eine Beobachtung zur aktuellen Entwicklung Betrachtet man die Ankündigungen der führenden KI-Unternehmen der letzten Monate, fällt auf: Der Fokus liegt verstärkt auf

Weiterlesen »
KI im Einsatz

Mistral Le Chat Update: Diese Features musst du jetzt kennen

Ich habe großartige Neuigkeiten für alle, die mit Mistral AI’s Le Chat arbeiten. Das Team hat ein umfangreiches Update veröffentlicht, das die Art und Weise, wie wir mit KI interagieren, revolutionieren wird. In diesem Beitrag werden wir die wichtigsten neuen Funktionen und Verbesserungen besprechen, die du kennen solltest. Mistral AI ist ein französisches KI-Startup, das seit 2023 von ehemaligen Meta- und DeepMind-Forschern geführt wird und sich durch seine Open-Source-Sprachmodelle sowie den KI-Assistenten Le Chat als

Weiterlesen »
KI im Einsatz

Flightright: Tiny Passengers – Ein KI-Maskottchen für mehr Fluggastrechte

Wir durften der Agentur MDCT bei der Entwicklung des KI-gestützten Maskottchens Tiny Passenger für die innovative Kampagne von Flightright unterstützen und dabei entstand ein Paradebeispiel für den optimalen und kreativen Einsatz von Bild-KI in der Kampagnenentwicklung.    In diesem Beitrag zeigen wir dir Schritt für Schritt, wie Georg und die Agentur MDCT bei der Entwicklung des Passenger vorgegangen sind.  Du wirst lernen, wie KI-Bildgeneratoren wie Midjourney und SDXL genutzt werden können, um einzigartige und emotionale Charaktere

Weiterlesen »
KI im Einsatz

FLUX.1 Tools: Die neue KI-Toolbox für präzise Bildbearbeitung

Generative KI erreicht mit den neuen FLUX.1 Tools einen weiteren Meilenstein in der präzisen Bildbearbeitung. Das Freiburger Start-up Black Forest Labs, bekannt durch seinen beeindruckenden Bildgenerator FLUX.1, stellt nun vier spezialisierte Werkzeuge vor, die das kreative Arbeiten mit KI jetzt viel flexibler machen. Die Tools – Fill, Depth, Canny und Redux – erweitern die Möglichkeiten der Bildmanipulation erheblich und sind sowohl als Open-Source-Variante für Entwickler als auch als Pro-Version über die API verfügbar. Besonders spannend

Weiterlesen »

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳