Stable Diffusion 2.0 Release – Fluch oder Segen?

Es ist erst ein paar Monate her, dass Stable Diffusion 1.0 Release neue Welten für die Kreativwelt geöffnet hat. Nun hat Stability.ai schon neue Stable Diffusion 2.0 Models veröffentlicht. Ist das Ganze nur ein aufgefrischtes Model oder ein wirklicher Gamechanger? In diesem Beitrag bekommt Ihr die wichtigsten Änderungen zusammengefasst.

First things first: Es formen sich zwei Hardliner-Fronten: Viele werden diesen Release hassen und einige feiern. Der Shitstorm ist bereits im Gange. Aber warum?

 

Stable Diffusion 2.0 Änderungen im Überblick

 

Stability.ai hat begonnen, die rechtlichen und ethischen Implikation in ihrem Model-Training zu berücksichtigen.

 

Die neu veröffentlichen Models wurden mit Datensätzen von Laion-5B generiert, welche dann noch weiter gefiltert wurden, um „adult content“ content zu unterbinden. Ein Not Safe For Work Filter eben. 

Das für uns als Marketer & Designer aber nicht weiter schlimm. Uns trifft etwas anderes: 

 

Kunststile und Trainingsdaten großer Kunstplattformen wurden beim Training bewusst von nutzbaren Klassen entkoppelt.

 

Ein mächtiges Werkzeug in der Bilderstellung war bis jetzt das Übertragen und Mischen von Kunststilen bekannter Künstler auf text2img- und img2img-Ergebnisse. Das gehört mit SD 2.0 in Teilen der Vergangenheit an. Es wird vermutet, dass die entsprechenden Datensätze bekannter Künstler zwar für das Training verwendet wurden, aber von nutzbaren Klassen entkoppelt sind. So sollen künftige Rechtsstreits und Sammelklagen unterbunden werden. Wer also gerne Bilder im Stil von Greg Rutkowski oder anderen beliebten prompt-Addons genutzt hat, wird  enttäuscht werden. 

Jetzt aber genug genörgelt – kommen wir zum Positiven:

 

Höhere Auflösung & bessere fotorealistische Ergebnisse

 

Die neuen Models wurden mit höher aufgelösten Trainingsdaten gefüttert – 768×768 ist das neue 512×512. Aber da endet die Reise nicht. Es wurde ein spezielles Upscaling Model vorgestellt, das auf eine 4-fach Vergrößerung ausgelegt ist. Das impliziert Auflösungen von 2048×2048 und höher! 
Hochauflösende Ergebnisse mit sehr vielen Details und fotorealistischem Look sind also schon jetzt mit überschaubarer Rechenleistung in kurzer Zeit erreichbar. 

 

Bild: Stability AI – https://github.com/Stability-AI/stablediffusion/blob/main/assets/stable-samples/txt2img/

 

Neues img2img Feature: depth2image

 

img2img hat ein neues bahnbrechendes Feature erhalten: Ein Model, das für formbeständige Ergebnisse sorgt. Das Input-Image wird dabei einer Depth of Field Analyse unterzogen und sorgt für atemberaubende Ergebnisse, die ihre Grundform beibehalten.

 

Bild: Stability AI – https://github.com/Stability-AI/stablediffusion/blob/main/assets/stable-samples/depth2img/
Bild: Stability AI – https://github.com/Stability-AI/stablediffusion/blob/main/assets/stable-samples/depth2img/

 

TLDR;

 

Stable Diffusion zeigt technisch sehr innovative Ansätze, die uns künftig noch bessere Ergebnisse liefern werden. Besonders, wenn es um fotorealistische Entwürfe geht. Auf der anderen Seite wird der Einsatz von spezifischen Stilen bekannter Künstler erschwert, was bei Illustrationen und Gemälden ganz neue Ansätze im prompt-design erfordern wird. Aber hey – dafür habt ihr ja uns. Bis wir herausgefunden haben, wie damit umzugehen ist, kann man jederzeit auf ältere Models zurückgreifen. Open Source sei Dank!

 

Du willst den Umgang mit Stable Diffusion 2.0 lernen?

 

Dann ab in unser KI Marketing Bootcamp.

Veronika Hackl, die Promptqueen bei der Texterstellung und Georg Neumann, Experte für Bilderstellung und Designworkflows mit KI, zeigen euch im Bootcamp den Umgang mit künstlicher Intelligenz im Marketing. Ihr überspringt dabei einfach die hunderten Stunden Einarbeitungszeit und Recherche, die wir uns freudig angetan haben und taucht direkt in die konkrete Nutzung ein.

Also let’s go!

 

 

SD 1.5 prompt Beitragsbild: party, balloons, 3d render, pixar, octane render, hyperrealistic, 8k, vibrant colors

Das könnte Dich auch interessieren:
KI im Einsatz
KI-Bildgeneratoren im Test 2025: Midjourney, Flux, Firefly und Co. im großen Vergleich

KI-Bildgenerierung hat sich 2024 rasant weiterentwickelt. Was vor kurzem noch unmöglich schien, ist heute Realität: Fotorealistische Porträts, makellose Produktaufnahmen und überzeugende Marketing-Visualisierungen entstehen in Sekundenschnellen. Aber welcher Bildgenerator liefert die besten Ergebnisse für Marketing und Design?   In unserem umfassenden Praxistest haben wir uns die neuesten Versionen der führenden Tools vorgenommen: Von Midjourney 6.1 über DALL-E 3 und Adobe Firefly Image 3 bis hin zu aufstrebenden Plattformen wie Mystic V2.5 bzw. Flux 1.1 Pro, Flux

Weiterlesen »
Aktuelles
Marketing im Jahr der Künstlichen Intelligenz: Unser Rückblick auf 2024 und die nächsten Schritte

Letzte Woche hatten wir ein echt spannendes Webinar, in dem wir das KI-Marketingjahr 2024 Revue passieren ließen und einen Blick in die Zukunft, also auf 2025, geworfen haben. Was da alles passiert ist und was uns noch erwartet – das war schon beeindruckend! In diesem Blogbeitrag fassen wir die wichtigsten Punkte nochmal zusammen. Wir möchten euch einen Überblick über die Fortschritte, Herausforderungen und Zukunftsprognosen im Bereich KI-Marketing geben.  Inhaltsverzeichnis Rückblick 2024: Was hat uns bewegt?

Weiterlesen »
KI im Einsatz
Personalisiertes Kinderbuch mit KI: Ein Praxisguide für Flux und Claude

Von der Idee zum eigenen KI-Kinderbuch Kinderbücher selbst erstellen – das war lange Zeit Profis mit jahrelanger Erfahrung im Illustrieren und Geschichtenschreiben vorbehalten. Doch generative KI macht es möglich: Heute können auch Menschen ohne künstlerische Vorbildung eigene Kinderbücher gestalten. Und das sogar individualisiert aufs eigene Kind. 2023 habe ich mit ChatGPT und Stable Diffusion mein erstes KI-generiertes Kinderbuch „Mathilda auf dem Mond“ produziert. Die Geschichte meiner Tochter Mathilda und ihr Traum von einer Mondreise wurde

Weiterlesen »
Aktuelles
12 Days of OpenAI: Unsere Einschätzung zu o3, erweiterte Suche, API-Features, WhatsApp, Desktop-Integrationen & Co

Die „12 Days of OpenAI“ sind vorbei, und hier ist unsere Analyse der letzten fünf Tage. Es wurden einige beeindruckende neue Features und Modelle vorgestellt, die unsere Arbeit mit KI sicherlich beinflussen werden. Die ersten sieben Tage unserer Analyse findest du hier: „12 Days of OpenAI: Unsere Auswertung der ersten 7 Tage mit Sora, O1, ChatGPTpro, RFT, Canvas & Co.„. Lass uns jetzt direkt in die Highlights der letzten fünf Tage schauen. Achja, da war

Weiterlesen »
Aktuelles
12 Days of OpenAI: Unsere Auswertung der ersten 7 Tage mit Sora, O1, ChatGPTpro, RFT, Canvas & Co.

Die KI-Welt erlebt gerade ihren ganz eigenen Adventskalender: OpenAI hat am 5. Dezember die „12 Days of OpenAI“ gestartet – eine beispiellose Innovations-Offensive, bei der das Unternehmen an zwölf aufeinanderfolgenden Werktagen neue Funktionen, Produkte und Demos vorstellt. Inhaltsverzeichnis Warum 12 Days of OpenAI? Diese Initiative kommt zu einem spannenden Zeitpunkt: Zwei Jahre nach der bahnbrechenden Einführung von ChatGPT zeigt OpenAI, dass sie weiterhin die Innovationsführerschaft im KI-Bereich beanspruchen. Die täglichen Livestreams mit Sam Altman &

Weiterlesen »
An AI Literacy Canvas displayed on a computer monitor. The canvas has a structured layout with eight distinct blocks, each containing text and icons. The blocks are organized in two rows with four columns each, featuring a mix of headings, descriptions, and visuals such as graphs, gears, robotic arms, and people interacting with AI concepts. The surrounding environment includes stylized books, charts, leaves, and gears in an orange, white, and gray color palette, symbolizing learning, innovation, and AI.
KI im Einsatz
AI Literacy Canvas: KI Kenntnisse gezielt entwickeln

Mit dem AI Literacy Canvas entwickelst du systematisch die KI-Kompetenzen, die dein Team wirklich braucht. Praxisnah, EU-AI Act-konform und sofort einsetzbar.   Denn 2024 war geprägt von KI-Schulungen und Personalentwicklung nach dem Gießkannen-Prinzip. 2025 kämpfen wir dafür, dass mehr Wert gelegt wird auf den Kontextbezug. Wie soll KI von wem überhaupt eingesetzt werden? Dazu haben wir ein Werkzeug vorbereitet:   Das AI Literacy Canvas wurde entwickelt, um KI Kenntnisse kontextbezogen zu vermitteln – das fordert

Weiterlesen »

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳