ControlNet macht Stable Diffusion noch mächtiger

Vor ein paar Tagen wurde ControlNet veröffentlicht. Eine neurale Netzwerkstruktur, die latent diffusion Modellen extra Konditionen hinzufügt. Den Techtalk bei Seite geschoben: Stable Diffusion kann jetzt um einiges mehr. 

 

Durch das Hinzufügen der verschiedenen Konditionen können jetzt per img2img Verständnis für menschliche Posen, Formen, Skizzen und sogar einzelne Flächen implementiert werden, wodurch sich ganz neue Möglichkeiten eröffnen. 

 

 

Stable Diffusion ist ein ganzes Stück schlauer geworden.

Bildinhalte austauschen?
Easy mit Canny Edge.

 

Pix2Pix war gestern – durch die Edge Maps wird der Original Bildaufbau beibehalten und durch den Prompt ersetzt.

Interiordesign eines Raumes anpassen?
Ein Klick mit Line Maps.

 

Besonders für Architekten und Inneneinrichter höchst spannend. 

Stilisierung von Bildern?
Noch viel besser als vorher.

 

 

Die HED Maps erlauben es möglichst viele markante Details aus dem Ursprungsbild in neue Ergebnisse mit anderen Stilen zu übertragen. 

Bilder aus Skizzen erstellen?
Unglaubliche Ergebnisse.

 

 

Das ging schon früher mit img2img – aber nun auch auf einem ganz neuen Level. 

Skizzen aus Bildern erstellen, aus denen dann wiederum neue Bilder entstehen?
Faulheit siegt!

 


Der Usecase aus der Github-Page spricht für sich.

Bilder aus Skizzen erstellen?
Unglaubliche Ergebnisse.

 

 

 

Das ging schon früher mit img2img – aber nun auch auf einem ganz neuen Level. 

Menschliche Posen aus einem Bild auf neue übertragen? ENDLICH! Das openpose Model machts möglich.

 

 

 

Nächster Step: Hände 🥳 

Natürlich habe ich das Ganze für euch direkt getestet. 

Testreihe im Scribble Mode

Stable Diffusion – Model: Analog Diffusion (SD 1.5)

Testreihe mit Openpose Model

Stable Diffusion – Model: Analog Diffusion (SD 1.5)

Du willst auch das Skillset rund um Stable Diffusion erlernen? Dann komm in unser Bootcamp oder sprich uns zu einer individuellen Beratung an.

Das könnte Dich auch interessieren:
KI im Einsatz
Tagebuch einer Lernreise: Wie ich mit KI und n8n Prozesse automatisiere

Inhaltsverzeichnis Moin!   Ich bin Kathi, Teil des KI Marketing Bootcamps, und setze mich gerade intensiv damit auseinander, wie man sich mit Automatisierungen das Leben leichter machen kann.   Aktuell tauche ich tief in das Tool n8n ein – ein mächtiges No-Code-Werkzeug, mit dem sich wiederkehrende Abläufe im Marketing-Alltag automatisieren lassen. Unterstützt werde ich dabei von Marcel, der mir als Coach zeigt, wie man Prozesse strukturiert analysiert, visualisiert und schließlich so aufbaut, dass sie uns

Weiterlesen »
Aktuelles
Adobe Firefly Image 4: Qualität besser – aber viele runzeln die Stirn

„Adobe holt auf – aber reicht das?“ Georg hat’s letzte Woche auf LinkedIn treffend formuliert. Das neue Image 4 Modell liefert sichtbar bessere Ergebnisse – Gesichter, Hände, Details: alles deutlich realistischer. Aber dann kommt der Moment, in dem viele unwillkürlich die Stirn runzeln: Nur zehn Bilder pro Monat kostenlos, auch für zahlende Creative-Cloud-Nutzer:innen. Wer mehr will – oder Zugang zu den neuen externen Modellen wie Google Imagen oder OpenAI Image 1 – darf zusätzlich zahlen.

Weiterlesen »
Aktuelles
Mistral Le Chat: Was die kostenlose Beta jetzt wirklich kann

Mistral Le Chat ist kein neues Tool – bereits 2024 als Open-Source-Alternative zu ChatGPT vorgestellt, war es vor allem in Entwicklerkreisen ein Gesprächsthema. Doch während das Unternehmen Mistral durch seine leistungsfähigen Modelle wie „Mixtral“ früh Aufmerksamkeit bekam, blieb der hauseigene Chatbot für viele eher im Hintergrund.   Mit dem Update im Winter und dem aktuellen Beta-Zugang hat sich das verändert. Die Webversion von Le Chat bietet inzwischen eine ganze Reihe praktischer Funktionen – und das

Weiterlesen »
Aktuelles
ChatGPT-Features für Marketer: Deep Research, Canvas, Projects, Custom GPTs & Co

In den letzten beiden Blogbeiträgen haben wir uns bereits intensiv mit den unterschiedlichen OpenAI-Modellen (hier geht’s zum Vergleich der Modelle) und der Nutzung des neuen Bildgenerators (mehr dazu hier) beschäftigt. Heute werfen wir einen genaueren Blick auf die spannenden Funktionen, die OpenAI innerhalb von ChatGPT anbietet – und wie du sie gezielt für dein Marketing nutzen kannst. Inhaltsverzeichnis Zack zack – hier direkt zur Übersicht! Canvas: Interaktives Schreiben mit KI Canvas ist eine Benutzeroberfläche in

Weiterlesen »
Aktuelles
Mehr als nur Text: So nutzt du den ChatGPT 4o Image Generator fürs Marketing

Wir kennen ChatGPT längst als zuverlässigen Texter, der uns bei allem von Headlines bis Blogartikeln unterstützt. Doch mittlerweile kann er noch mehr – und zwar Bilder erstellen. Nicht wirklich neu für alle, die sich mit KI beschäftigen, aber spannend bleibt’s trotzdem: Aus dem reinen Schreibassistenten wird ein visueller Kreativpartner. Und das Beste? Alles läuft direkt im gewohnten Chatfenster ab – ganz ohne Toolswitch. Für uns im Marketing eröffnet das neue Möglichkeiten: Content-Ideen lassen sich schneller

Weiterlesen »
Aktuelles
OpenAI-Modelle im Vergleich: GPT-4o, GPT-4.5, o3 & Co für Marketing-Teams

Gefühlt gibt es plötzlich ein halbes Dutzend verschiedene ChatGPT-Modelle – und ständig kommt ein neues dazu. GPT-4, GPT-4o, GPT-4.5, o1, o3 Mini, Mini High, Turbo… Moment mal – was soll das alles eigentlich heißen? Für viele fühlt sich das ein bisschen an wie ein Upgrade-Dschungel: Man will einfach nur wissen, was das richtige Modell für den eigenen Use Case ist – und wird stattdessen mit Abkürzungen, Preisen und Features bombardiert. Aber keine Sorge: Genau darum

Weiterlesen »

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳