Stable Diffusion 2.0 Release – Fluch oder Segen?

Es ist erst ein paar Monate her, dass Stable Diffusion 1.0 Release neue Welten für die Kreativwelt geöffnet hat. Nun hat Stability.ai schon neue Stable Diffusion 2.0 Models veröffentlicht. Ist das Ganze nur ein aufgefrischtes Model oder ein wirklicher Gamechanger? In diesem Beitrag bekommt Ihr die wichtigsten Änderungen zusammengefasst.

First things first: Es formen sich zwei Hardliner-Fronten: Viele werden diesen Release hassen und einige feiern. Der Shitstorm ist bereits im Gange. Aber warum?

 

Stable Diffusion 2.0 Änderungen im Überblick

 

Stability.ai hat begonnen, die rechtlichen und ethischen Implikation in ihrem Model-Training zu berücksichtigen.

 

Die neu veröffentlichen Models wurden mit Datensätzen von Laion-5B generiert, welche dann noch weiter gefiltert wurden, um „adult content“ content zu unterbinden. Ein Not Safe For Work Filter eben. 

Das für uns als Marketer & Designer aber nicht weiter schlimm. Uns trifft etwas anderes: 

 

Kunststile und Trainingsdaten großer Kunstplattformen wurden beim Training bewusst von nutzbaren Klassen entkoppelt.

 

Ein mächtiges Werkzeug in der Bilderstellung war bis jetzt das Übertragen und Mischen von Kunststilen bekannter Künstler auf text2img- und img2img-Ergebnisse. Das gehört mit SD 2.0 in Teilen der Vergangenheit an. Es wird vermutet, dass die entsprechenden Datensätze bekannter Künstler zwar für das Training verwendet wurden, aber von nutzbaren Klassen entkoppelt sind. So sollen künftige Rechtsstreits und Sammelklagen unterbunden werden. Wer also gerne Bilder im Stil von Greg Rutkowski oder anderen beliebten prompt-Addons genutzt hat, wird  enttäuscht werden. 

Jetzt aber genug genörgelt – kommen wir zum Positiven:

 

Höhere Auflösung & bessere fotorealistische Ergebnisse

 

Die neuen Models wurden mit höher aufgelösten Trainingsdaten gefüttert – 768×768 ist das neue 512×512. Aber da endet die Reise nicht. Es wurde ein spezielles Upscaling Model vorgestellt, das auf eine 4-fach Vergrößerung ausgelegt ist. Das impliziert Auflösungen von 2048×2048 und höher! 
Hochauflösende Ergebnisse mit sehr vielen Details und fotorealistischem Look sind also schon jetzt mit überschaubarer Rechenleistung in kurzer Zeit erreichbar. 

 

Bild: Stability AI – https://github.com/Stability-AI/stablediffusion/blob/main/assets/stable-samples/txt2img/

 

Neues img2img Feature: depth2image

 

img2img hat ein neues bahnbrechendes Feature erhalten: Ein Model, das für formbeständige Ergebnisse sorgt. Das Input-Image wird dabei einer Depth of Field Analyse unterzogen und sorgt für atemberaubende Ergebnisse, die ihre Grundform beibehalten.

 

Bild: Stability AI – https://github.com/Stability-AI/stablediffusion/blob/main/assets/stable-samples/depth2img/
Bild: Stability AI – https://github.com/Stability-AI/stablediffusion/blob/main/assets/stable-samples/depth2img/

 

TLDR;

 

Stable Diffusion zeigt technisch sehr innovative Ansätze, die uns künftig noch bessere Ergebnisse liefern werden. Besonders, wenn es um fotorealistische Entwürfe geht. Auf der anderen Seite wird der Einsatz von spezifischen Stilen bekannter Künstler erschwert, was bei Illustrationen und Gemälden ganz neue Ansätze im prompt-design erfordern wird. Aber hey – dafür habt ihr ja uns. Bis wir herausgefunden haben, wie damit umzugehen ist, kann man jederzeit auf ältere Models zurückgreifen. Open Source sei Dank!

 

Du willst den Umgang mit Stable Diffusion 2.0 lernen?

 

Dann ab in unser KI Marketing Bootcamp.

Veronika Hackl, die Promptqueen bei der Texterstellung und Georg Neumann, Experte für Bilderstellung und Designworkflows mit KI, zeigen euch im Bootcamp den Umgang mit künstlicher Intelligenz im Marketing. Ihr überspringt dabei einfach die hunderten Stunden Einarbeitungszeit und Recherche, die wir uns freudig angetan haben und taucht direkt in die konkrete Nutzung ein.

Also let’s go!

 

 

SD 1.5 prompt Beitragsbild: party, balloons, 3d render, pixar, octane render, hyperrealistic, 8k, vibrant colors

Das könnte Dich auch interessieren:
Aktuelles
Mehr als nur Text: So nutzt du den ChatGPT 4o Image Generator fürs Marketing

Wir kennen ChatGPT längst als zuverlässigen Texter, der uns bei allem von Headlines bis Blogartikeln unterstützt. Doch mittlerweile kann er noch mehr – und zwar Bilder erstellen. Nicht wirklich neu für alle, die sich mit KI beschäftigen, aber spannend bleibt’s trotzdem: Aus dem reinen Schreibassistenten wird ein visueller Kreativpartner. Und das Beste? Alles läuft direkt im gewohnten Chatfenster ab – ganz ohne Toolswitch. Für uns im Marketing eröffnet das neue Möglichkeiten: Content-Ideen lassen sich schneller

Weiterlesen »
Aktuelles
OpenAI-Modelle im Vergleich: GPT-4o, GPT-4.5, o3 & Co für Marketing-Teams

Gefühlt gibt es plötzlich ein halbes Dutzend verschiedene ChatGPT-Modelle – und ständig kommt ein neues dazu. GPT-4, GPT-4o, GPT-4.5, o1, o3 Mini, Mini High, Turbo… Moment mal – was soll das alles eigentlich heißen?   Für viele fühlt sich das ein bisschen an wie ein Upgrade-Dschungel: Man will einfach nur wissen, was das richtige Modell für den eigenen Use Case ist – und wird stattdessen mit Abkürzungen, Preisen und Features bombardiert. Aber keine Sorge: Genau

Weiterlesen »
Aktuelles
Midjourney V7 ist da – Was das neue Modell fürs Marketing bedeutet

Mit Midjourney V7 ist das neue Bildgenerierungsmodell offiziell da – und bringt einige spannende Veränderungen mit. Die Bildqualität hat sich deutlich weiterentwickelt, neue Modi wie der Draft Mode versprechen schnellere Ergebnisse, und auch die Detailtiefe bei Gesichtern, Lichtstimmungen und Texturen wurde spürbar verbessert.   Doch was bedeutet das konkret für den Einsatz im Marketing?Welche neuen Möglichkeiten ergeben sich für Kreative, Marken und Kampagnen – und wo stößt V7 (noch) an seine Grenzen?   In diesem

Weiterlesen »
Aktuelles
KI & HR: Was der EU AI Act für Personalabteilungen bedeutet – Ein Interview mit Kirstin Elisabeth Koubé 2.0

Die Verabschiedung des EU AI Acts markiert einen Meilenstein in der Regulierung künstlicher Intelligenz (KI) innerhalb der Europäischen Union. Diese neue Verordnung legt nicht nur technische Standards für KI-Systeme fest, sondern hebt auch die Bedeutung der Weiterentwicklung von KI-Kompetenzen in Unternehmen hervor. Insbesondere Artikel 4 betont, dass Unternehmen geeignete Schulungs- und Weiterbildungsmaßnahmen fördern sollten, um den verantwortungsvollen Umgang mit KI zu gewährleisten.   In einem früheren Blogbeitrag: „EU AI Act: werden KI-Schulungen zur Pflicht?“ haben wir

Weiterlesen »
Aktuelles
Vibe Marketing mit KI: Effizienz-Booster oder Einheitsbrei in Hochgeschwindigkeit?

„Vibe Marketing“ – das klingt erstmal nach TikTok, After-Work-Gin und einem schicken Buzzword für Agenturpräsentationen. Tatsächlich beschreibt der Begriff aber eine Entwicklung, die gerade viele Marketingteams (und Solo-Marketer) massiv beeinflusst – und zwar nicht nur im positiven Sinne. Denn im Kern geht es bei Vibe Marketing um eines: Möglichst schnell und flexibel auf Stimmungen, Trends und Zielgruppenbedürfnisse zu reagieren. Möglich wird das durch KI-gestützte Tools, die Texte, Bilder, Videos und Ideen in Rekordzeit produzieren –

Weiterlesen »
Aktuelles
Ist Freepik die eierlegende Wollmilchsau unter den Bildgeneratoren?

KI Tools im Marketing gibt es viele – aber welche bringen wirklich Ergebnisse? Und vor allem: Wie kannst du sie praxisnah anwenden?   Genau diese Frage stellen wir uns regelmäßig im KI Marketing Bootcamp. Denn Theorie ist gut, Praxis ist besser. Deshalb setzen wir auf Hands-on-Training mit den besten KI Tools. Eines davon – oder besser gesagt, unser neuer Favorit: Freepik. Warum? Weil es die perfekte Brücke zwischen Idee und Umsetzung ist – und zeigt,

Weiterlesen »

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳