ControlNet macht Stable Diffusion noch mächtiger

Vor ein paar Tagen wurde ControlNet veröffentlicht. Eine neurale Netzwerkstruktur, die latent diffusion Modellen extra Konditionen hinzufügt. Den Techtalk bei Seite geschoben: Stable Diffusion kann jetzt um einiges mehr. 

 

Durch das Hinzufügen der verschiedenen Konditionen können jetzt per img2img Verständnis für menschliche Posen, Formen, Skizzen und sogar einzelne Flächen implementiert werden, wodurch sich ganz neue Möglichkeiten eröffnen. 

 

 

Stable Diffusion ist ein ganzes Stück schlauer geworden.

Bildinhalte austauschen?
Easy mit Canny Edge.

 

Pix2Pix war gestern – durch die Edge Maps wird der Original Bildaufbau beibehalten und durch den Prompt ersetzt.

Interiordesign eines Raumes anpassen?
Ein Klick mit Line Maps.

 

Besonders für Architekten und Inneneinrichter höchst spannend. 

Stilisierung von Bildern?
Noch viel besser als vorher.

 

 

Die HED Maps erlauben es möglichst viele markante Details aus dem Ursprungsbild in neue Ergebnisse mit anderen Stilen zu übertragen. 

Bilder aus Skizzen erstellen?
Unglaubliche Ergebnisse.

 

 

Das ging schon früher mit img2img – aber nun auch auf einem ganz neuen Level. 

Skizzen aus Bildern erstellen, aus denen dann wiederum neue Bilder entstehen?
Faulheit siegt!

 


Der Usecase aus der Github-Page spricht für sich.

Bilder aus Skizzen erstellen?
Unglaubliche Ergebnisse.

 

 

 

Das ging schon früher mit img2img – aber nun auch auf einem ganz neuen Level. 

Menschliche Posen aus einem Bild auf neue übertragen? ENDLICH! Das openpose Model machts möglich.

 

 

 

Nächster Step: Hände 🥳 

Natürlich habe ich das Ganze für euch direkt getestet. 

Testreihe im Scribble Mode

Stable Diffusion – Model: Analog Diffusion (SD 1.5)

Testreihe mit Openpose Model

Stable Diffusion – Model: Analog Diffusion (SD 1.5)

Du willst auch das Skillset rund um Stable Diffusion erlernen? Dann komm in unser Bootcamp oder sprich uns zu einer individuellen Beratung an.

Wer hat's geschrieben?

Das könnte Dich auch interessieren:
KI im Einsatz
KI-Bilder ohne Einheitsbrei: 3 Hebel für authentische Bild-KI-Ergebnisse

Drei Tools, drei Prompts, drei Bilder. Und am Ende sieht alles gleich aus: glatte Oberflächen, weichgespültes Licht, dieser typische KI-Schimmer. Das Modell ist nicht das Problem. Bild-KI ist mittlerweile verdammt gut. Wer sie nur oberflächlich bedient, bekommt trotzdem Einheitsbrei. Ich arbeite jeden Tag mit Bild-KI, und drei Dinge entscheiden für mich darüber, ob am Ende ein brauchbares Bild rauskommt oder nur der nächste austauschbare Treffer. Keine geheimen Tools. Workflow. Hebel 1: Moodboard schlägt Buzzword-Prompt Die

Weiterlesen »
KI im Einsatz
Karl bekommt seine Bühne: Maskottchen-Vorstellung mit Claude Cowork in einer Stunde

Κarl ist seit Jahren da. Im Newsletter, zwischen Blogbeiträgen, manchmal als kleines Wesen am Slide-Rand. Trotzdem hat ihn nie jemand offiziell vorgestellt. Kein Steckbrief, keine Mission, kein „Hi, ich bin Karl“. Diese Lücke wollte ich schließen. Nicht in zwei Tagen, sondern in einer Sitzung. Mein Werkzeug der Wahl: Claude Cowork. Was dabei rausgekommen ist: ein 10-Slide-Deck, das Karl von der Begrüßung bis zum LinkedIn-Debüt komplett aufzieht. Ein wiederverwendbarer Skill für jede künftige Markenfigur. Und die

Weiterlesen »
Aktuelles
Warum „10 Nachrichten pro Tag“ als KI-Limit ausgedient hat

Wer in den letzten Wochen Mails von KI-Anbietern bekommen hat, in denen plötzlich neue Nutzungslimits erklärt werden, ist nicht allein. Langdock hat es gerade öffentlich gemacht, OpenAI und Anthropic haben es schon länger in ihren Tarifen umgesetzt: Der Industriestandard verschiebt sich gerade von Nachrichten-Limits zu kostenbasierten Limits. Klingt nach einer Detailfrage für Admins. Ist aber für jedes Marketing-Team relevant, das täglich mit KI arbeitet. Das Problem: Eine Nachricht ist nicht mehr eine Nachricht Vor drei Jahren war

Weiterlesen »
Uncategorized
Von SEO zu GEO: So sicherst du dir einen Platz in der KI-Antwort

Immer mehr Menschen tippen ihre Fragen nicht mehr in Google, sondern direkt in ChatGPT, Perplexity oder Gemini, und bekommen eine fertige Antwort, ohne überhaupt eine Website zu besuchen. Für dich heißt das: Wenn deine Inhalte in dieser Antwort nicht auftauchen, bist du unsichtbar. Willkommen im Zeitalter der Generative Engine Optimization (GEO). Vroni hat zu diesem Thema einen Beitrag im Magazin von gate-germany.de mitgestaltet. Der Fokus liegt zwar auf Hochschulen, die Logik lässt sich aber 1:1 aufs

Weiterlesen »
KI News
Midjourney V8.1: 2026 endlich in 2025 angekommen

Midjourney V8.1 ist da. Hände funktionieren, Gesichter sitzen, die Ästhetik stimmt wieder. Willkommen im Jahr 2025 – nur eben mit zwölf Monaten Verspätung. Während Midjourney zwei Releases brauchte, um den eigenen Vorgänger V7 wieder einzuholen, haben Nano Banana 2 und GPT-Image-2 die Messlatte in praktisch jeder marketingrelevanten Kategorie nach oben geschoben. Die These: Midjourney V8.1 ist ein solides Comeback – aber kein Anschluss an die Spitze. Und genau darin liegt eine Lektion über den Unterschied

Weiterlesen »
KI News
ChatGPT 5.5 2026: Wie OpenAI vom Chatbot zur Arbeitsoberfläche wechselt

ChatGPT ist im Frühjahr 2026 nicht einfach besser geworden. Das Produkt wird zu etwas anderem. Innerhalb einer Woche hat OpenAI Workspace Agents (22. April), GPT-5.5 (23. April), Images 2.0 (21. April) und Fast Answers (22. April) ausgerollt, dazu kommt das verbesserte Memory aus dem Januar. Wer all das nebeneinanderlegt, sieht keine zufällige Update-Welle, sondern eine strategische Verschiebung. Weg vom Antwortgenerator, hin zur Arbeitsoberfläche für Wissensarbeit. Wir haben uns die Releases angeschaut. Das Muster hinter den

Weiterlesen »

Hey Du. Willst du AI Content Manager werden?

Dann ab ins kostenfreie Info-Webinar am 25.03. um 12:00 Uhr. 

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳