Stable Diffusion SDXL 1.0 – Gamechanger oder Gurke?

Der Fortschritt in der Welt der Künstlichen Intelligenz (KI) ist atemberaubend und bietet stetig neue Möglichkeiten. Am 26. Juli 2023 wurde SDXL 1.0 als neues Basis-Model von Stable Diffusion veröffentlicht. Wir haben uns die Zeit genommen, das neue Bildgenerierungs-Model ausgiebig auszuprobieren. Soviel vorweg: Definitiv Gamechanger! Hier teilen wir unsere Eindrücke:

 

1. Handhabung und Integration

Leider ist die Handhabung von SDXL 1.0 momentan noch etwas holprig. Die Integration in Automatic1111 könnte noch etwas Feinschliff gebrauchen. Für diejenigen, die eine alternative Route wählen möchten, steht das node-basierte ComfyUI zur Verfügung. Hierbei handelt es sich jedoch um ein eher komplexes Interface, welches Anfänger vielleicht abschrecken könnte.

 

 

2. Bildqualität

Das Herzstück eines jeden Bildgenerierungs-Models. Und hier punktet SDXL 1.0 gewaltig! Die Bildqualität ist phänomenal. Selbst ohne feines Tuning liefert das Modell bereits mit einfachen Prompts brillante Ergebnisse. Ein besonderes Highlight ist die feste Integration von Offset Noise im Training, wodurch Bilder entstehen, die in Sachen Kontrast mit denen des Konkurrenten Midjourney mithalten können.

 

 

3. Prompting

Ein wesentlicher Vorteil des neuen SDXL 1.0 ist das verbesserte Textverständnis. Dies spart nicht nur Zeit, sondern auch Nerven. Besonders hervorzuheben ist, dass die Tage der langen, umständlichen negativen Prompts aus Stable Diffusion 1.5 Zeiten gezählt sind. Nun kann man sich wirklich auf das Wesentliche konzentrieren, was den Prozess erheblich beschleunigt.

 

SDXL 1.0 Testreihe mit negative Prompt:

SDXL 1.0 Testreihe ohne negative Prompt:

Prompt: medium shot photo of a happy 40 year old business woman with ginger hair, freckles, munich, beautiful detailed face, dramatic lighting, 50mm, F1.8, film grain, chromatic aberations, analog photography


Negative: animation,doll,anime,painting,cartoon,drawing,illustration,3d,sketch,surreal,(cropped head), (cropped body),out of frame,crossed eyes, bad hands,((disfigured)),((deformed)),strange anatomy,(bad proportions),((extra limbs)),(ugly),((b&w)),weird colors,blurry,((monochrome)),lowres,(low quality:2),jpeg artifacts

 

4. Training

Einfach beeindruckend! Wir haben den ultimativen Test gemacht: Georg Neumann hat basierend auf 109 Fotos ein eigenes SDXL 1.0 Model trainiert. Ohne aufwändiges Captioning oder sorgfältige Bildauswahl entstand in nur 10.000 Steps ein hochwertiges Modell.

 

Trainingsdaten:

 

 

Testgenerierungen

 

 

Georgs Reaktion?

„Wow! Wenn das nur der Anfang ist, bin ich gespannt, wo wir in ein paar Monaten sein werden, besonders wenn wir mit bereits feingetunten Models aus der Community arbeiten können.“

 

Unser Fazit zu SDXL 1.0

Die Zeichen stehen auf Innovation. SDXL 1.0 ist nicht einfach nur ein neues Update – es markiert einen bedeutenden Schritt nach vorne. Dies spiegelt sich auch in der begeisterten Aufnahme durch die Open-Source-Community wider. Sogar eingefleischte Fans von Stable Diffusion 1.5 erkennen das Potential und wechseln bereits. Mit den ständig erscheinenden, hochwertigen Embeddings und feingetunten Models steht der KI-Bildgenerierung eine strahlende Zukunft bevor.

Das könnte Dich auch interessieren:

KI im Einsatz

Stagniert die Entwicklung der Sprachmodelle? Ein Update für Marketer

OpenAI veröffentlicht grad feature um feature. Doch bei den Sprachmodellen, dem eigentlichen Kern des Ganzen, zeigt sich vergleichsweise wenig Entwicklung.   Während die großen Player am Markt ständig neue Features und Anwendungsmöglichkeiten präsentieren, scheinen die grundlegenden Fortschritte in der Modelltechnologie etwas langsamer zu werden. Ein subjektiver Eindruck, der einen genaueren Blick verdient. Inhaltsverzeichnis Eine Beobachtung zur aktuellen Entwicklung Betrachtet man die Ankündigungen der führenden KI-Unternehmen der letzten Monate, fällt auf: Der Fokus liegt verstärkt auf

Weiterlesen »
KI im Einsatz

Mistral Le Chat Update: Diese Features musst du jetzt kennen

Ich habe großartige Neuigkeiten für alle, die mit Mistral AI’s Le Chat arbeiten. Das Team hat ein umfangreiches Update veröffentlicht, das die Art und Weise, wie wir mit KI interagieren, revolutionieren wird. In diesem Beitrag werden wir die wichtigsten neuen Funktionen und Verbesserungen besprechen, die du kennen solltest. Mistral AI ist ein französisches KI-Startup, das seit 2023 von ehemaligen Meta- und DeepMind-Forschern geführt wird und sich durch seine Open-Source-Sprachmodelle sowie den KI-Assistenten Le Chat als

Weiterlesen »
KI im Einsatz

Flightright: Tiny Passengers – Ein KI-Maskottchen für mehr Fluggastrechte

Wir durften der Agentur MDCT bei der Entwicklung des KI-gestützten Maskottchens Tiny Passenger für die innovative Kampagne von Flightright unterstützen und dabei entstand ein Paradebeispiel für den optimalen und kreativen Einsatz von Bild-KI in der Kampagnenentwicklung.    In diesem Beitrag zeigen wir dir Schritt für Schritt, wie Georg und die Agentur MDCT bei der Entwicklung des Passenger vorgegangen sind.  Du wirst lernen, wie KI-Bildgeneratoren wie Midjourney und SDXL genutzt werden können, um einzigartige und emotionale Charaktere

Weiterlesen »
KI im Einsatz

FLUX.1 Tools: Die neue KI-Toolbox für präzise Bildbearbeitung

Generative KI erreicht mit den neuen FLUX.1 Tools einen weiteren Meilenstein in der präzisen Bildbearbeitung. Das Freiburger Start-up Black Forest Labs, bekannt durch seinen beeindruckenden Bildgenerator FLUX.1, stellt nun vier spezialisierte Werkzeuge vor, die das kreative Arbeiten mit KI jetzt viel flexibler machen. Die Tools – Fill, Depth, Canny und Redux – erweitern die Möglichkeiten der Bildmanipulation erheblich und sind sowohl als Open-Source-Variante für Entwickler als auch als Pro-Version über die API verfügbar. Besonders spannend

Weiterlesen »
KI im Einsatz

VDMB Jahresmagazin 2024: So haben wir die Bilder generiert

Manchmal entwickeln sich aus einem Workshop ganz besondere Projekte. So geschehen nach einer KI-Schulung in der VDMB Akademie, als die Anfrage kam, für das VDMB Jahresmagazin 2024 die Autorenportraits mittels künstlicher Intelligenz zu erstellen. Eine spannende Aufgabe, die nicht nur die Portraits der Autoren betraf, sondern auch in einem vierseitigen Interview über die Möglichkeiten von KI im Printbereich mündete. In diesem Artikel zeige ich dir, wie wir die KI-generierten Portraits für das Magazin entwickelt haben.

Weiterlesen »
KI im Einsatz

Flux LoRa Training: Freepik und krea.ai haben eure Daten zum Fressen gern

KI-generierte Bilder sind in aller Munde, und immer mehr Menschen möchten ihre eigenen KI-Modelle (LoRAs) trainieren. Sowohl krea.ai als auch Freepik bieten dafür benutzerfreundliche Services an, die das mittels Flux ermöglichen – doch was passiert eigentlich mit den Bildern, die man zum Training hochlädt? Ein genauer Blick in die Nutzungsbedingungen offenbart, dass beide Plattformen sich weitreichende Rechte an den hochgeladenen Inhalten sichern. Während Freepik zumindest die Nutzung für KI-Training ausschließt, behält sich krea.ai praktisch alle

Weiterlesen »

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳