Stable Diffusion 2.0 Release – Fluch oder Segen?

Es ist erst ein paar Monate her, dass Stable Diffusion 1.0 Release neue Welten für die Kreativwelt geöffnet hat. Nun hat Stability.ai schon neue Stable Diffusion 2.0 Models veröffentlicht. Ist das Ganze nur ein aufgefrischtes Model oder ein wirklicher Gamechanger? In diesem Beitrag bekommt Ihr die wichtigsten Änderungen zusammengefasst.

First things first: Es formen sich zwei Hardliner-Fronten: Viele werden diesen Release hassen und einige feiern. Der Shitstorm ist bereits im Gange. Aber warum?

 

Stable Diffusion 2.0 Änderungen im Überblick

 

Stability.ai hat begonnen, die rechtlichen und ethischen Implikation in ihrem Model-Training zu berücksichtigen.

 

Die neu veröffentlichen Models wurden mit Datensätzen von Laion-5B generiert, welche dann noch weiter gefiltert wurden, um „adult content“ content zu unterbinden. Ein Not Safe For Work Filter eben. 

Das für uns als Marketer & Designer aber nicht weiter schlimm. Uns trifft etwas anderes: 

 

Kunststile und Trainingsdaten großer Kunstplattformen wurden beim Training bewusst von nutzbaren Klassen entkoppelt.

 

Ein mächtiges Werkzeug in der Bilderstellung war bis jetzt das Übertragen und Mischen von Kunststilen bekannter Künstler auf text2img- und img2img-Ergebnisse. Das gehört mit SD 2.0 in Teilen der Vergangenheit an. Es wird vermutet, dass die entsprechenden Datensätze bekannter Künstler zwar für das Training verwendet wurden, aber von nutzbaren Klassen entkoppelt sind. So sollen künftige Rechtsstreits und Sammelklagen unterbunden werden. Wer also gerne Bilder im Stil von Greg Rutkowski oder anderen beliebten prompt-Addons genutzt hat, wird  enttäuscht werden. 

Jetzt aber genug genörgelt – kommen wir zum Positiven:

 

Höhere Auflösung & bessere fotorealistische Ergebnisse

 

Die neuen Models wurden mit höher aufgelösten Trainingsdaten gefüttert – 768×768 ist das neue 512×512. Aber da endet die Reise nicht. Es wurde ein spezielles Upscaling Model vorgestellt, das auf eine 4-fach Vergrößerung ausgelegt ist. Das impliziert Auflösungen von 2048×2048 und höher! 
Hochauflösende Ergebnisse mit sehr vielen Details und fotorealistischem Look sind also schon jetzt mit überschaubarer Rechenleistung in kurzer Zeit erreichbar. 

 

Bild: Stability AI – https://github.com/Stability-AI/stablediffusion/blob/main/assets/stable-samples/txt2img/

 

Neues img2img Feature: depth2image

 

img2img hat ein neues bahnbrechendes Feature erhalten: Ein Model, das für formbeständige Ergebnisse sorgt. Das Input-Image wird dabei einer Depth of Field Analyse unterzogen und sorgt für atemberaubende Ergebnisse, die ihre Grundform beibehalten.

 

Bild: Stability AI – https://github.com/Stability-AI/stablediffusion/blob/main/assets/stable-samples/depth2img/
Bild: Stability AI – https://github.com/Stability-AI/stablediffusion/blob/main/assets/stable-samples/depth2img/

 

TLDR;

 

Stable Diffusion zeigt technisch sehr innovative Ansätze, die uns künftig noch bessere Ergebnisse liefern werden. Besonders, wenn es um fotorealistische Entwürfe geht. Auf der anderen Seite wird der Einsatz von spezifischen Stilen bekannter Künstler erschwert, was bei Illustrationen und Gemälden ganz neue Ansätze im prompt-design erfordern wird. Aber hey – dafür habt ihr ja uns. Bis wir herausgefunden haben, wie damit umzugehen ist, kann man jederzeit auf ältere Models zurückgreifen. Open Source sei Dank!

 

Du willst den Umgang mit Stable Diffusion 2.0 lernen?

 

Dann ab in unser KI Marketing Bootcamp.

Veronika Hackl, die Promptqueen bei der Texterstellung und Georg Neumann, Experte für Bilderstellung und Designworkflows mit KI, zeigen euch im Bootcamp den Umgang mit künstlicher Intelligenz im Marketing. Ihr überspringt dabei einfach die hunderten Stunden Einarbeitungszeit und Recherche, die wir uns freudig angetan haben und taucht direkt in die konkrete Nutzung ein.

Also let’s go!

 

 

SD 1.5 prompt Beitragsbild: party, balloons, 3d render, pixar, octane render, hyperrealistic, 8k, vibrant colors

Wer hat's geschrieben?

Das könnte Dich auch interessieren:
KI im Einsatz
KI-Bilder ohne Einheitsbrei: 3 Hebel für authentische Bild-KI-Ergebnisse

Drei Tools, drei Prompts, drei Bilder. Und am Ende sieht alles gleich aus: glatte Oberflächen, weichgespültes Licht, dieser typische KI-Schimmer. Das Modell ist nicht das Problem. Bild-KI ist mittlerweile verdammt gut. Wer sie nur oberflächlich bedient, bekommt trotzdem Einheitsbrei. Ich arbeite jeden Tag mit Bild-KI, und drei Dinge entscheiden für mich darüber, ob am Ende ein brauchbares Bild rauskommt oder nur der nächste austauschbare Treffer. Keine geheimen Tools. Workflow. Hebel 1: Moodboard schlägt Buzzword-Prompt Die

Weiterlesen »
KI im Einsatz
Karl bekommt seine Bühne: Maskottchen-Vorstellung mit Claude Cowork in einer Stunde

Κarl ist seit Jahren da. Im Newsletter, zwischen Blogbeiträgen, manchmal als kleines Wesen am Slide-Rand. Trotzdem hat ihn nie jemand offiziell vorgestellt. Kein Steckbrief, keine Mission, kein „Hi, ich bin Karl“. Diese Lücke wollte ich schließen. Nicht in zwei Tagen, sondern in einer Sitzung. Mein Werkzeug der Wahl: Claude Cowork. Was dabei rausgekommen ist: ein 10-Slide-Deck, das Karl von der Begrüßung bis zum LinkedIn-Debüt komplett aufzieht. Ein wiederverwendbarer Skill für jede künftige Markenfigur. Und die

Weiterlesen »
Aktuelles
Warum „10 Nachrichten pro Tag“ als KI-Limit ausgedient hat

Wer in den letzten Wochen Mails von KI-Anbietern bekommen hat, in denen plötzlich neue Nutzungslimits erklärt werden, ist nicht allein. Langdock hat es gerade öffentlich gemacht, OpenAI und Anthropic haben es schon länger in ihren Tarifen umgesetzt: Der Industriestandard verschiebt sich gerade von Nachrichten-Limits zu kostenbasierten Limits. Klingt nach einer Detailfrage für Admins. Ist aber für jedes Marketing-Team relevant, das täglich mit KI arbeitet. Das Problem: Eine Nachricht ist nicht mehr eine Nachricht Vor drei Jahren war

Weiterlesen »
Uncategorized
Von SEO zu GEO: So sicherst du dir einen Platz in der KI-Antwort

Immer mehr Menschen tippen ihre Fragen nicht mehr in Google, sondern direkt in ChatGPT, Perplexity oder Gemini, und bekommen eine fertige Antwort, ohne überhaupt eine Website zu besuchen. Für dich heißt das: Wenn deine Inhalte in dieser Antwort nicht auftauchen, bist du unsichtbar. Willkommen im Zeitalter der Generative Engine Optimization (GEO). Vroni hat zu diesem Thema einen Beitrag im Magazin von gate-germany.de mitgestaltet. Der Fokus liegt zwar auf Hochschulen, die Logik lässt sich aber 1:1 aufs

Weiterlesen »
KI News
Midjourney V8.1: 2026 endlich in 2025 angekommen

Midjourney V8.1 ist da. Hände funktionieren, Gesichter sitzen, die Ästhetik stimmt wieder. Willkommen im Jahr 2025 – nur eben mit zwölf Monaten Verspätung. Während Midjourney zwei Releases brauchte, um den eigenen Vorgänger V7 wieder einzuholen, haben Nano Banana 2 und GPT-Image-2 die Messlatte in praktisch jeder marketingrelevanten Kategorie nach oben geschoben. Die These: Midjourney V8.1 ist ein solides Comeback – aber kein Anschluss an die Spitze. Und genau darin liegt eine Lektion über den Unterschied

Weiterlesen »
KI News
ChatGPT 5.5 2026: Wie OpenAI vom Chatbot zur Arbeitsoberfläche wechselt

ChatGPT ist im Frühjahr 2026 nicht einfach besser geworden. Das Produkt wird zu etwas anderem. Innerhalb einer Woche hat OpenAI Workspace Agents (22. April), GPT-5.5 (23. April), Images 2.0 (21. April) und Fast Answers (22. April) ausgerollt, dazu kommt das verbesserte Memory aus dem Januar. Wer all das nebeneinanderlegt, sieht keine zufällige Update-Welle, sondern eine strategische Verschiebung. Weg vom Antwortgenerator, hin zur Arbeitsoberfläche für Wissensarbeit. Wir haben uns die Releases angeschaut. Das Muster hinter den

Weiterlesen »

Hey Du. Willst du AI Content Manager werden?

Dann ab ins kostenfreie Info-Webinar am 25.03. um 12:00 Uhr. 

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳