ControlNet macht Stable Diffusion noch mächtiger

Vor ein paar Tagen wurde ControlNet veröffentlicht. Eine neurale Netzwerkstruktur, die latent diffusion Modellen extra Konditionen hinzufügt. Den Techtalk bei Seite geschoben: Stable Diffusion kann jetzt um einiges mehr. 

 

Durch das Hinzufügen der verschiedenen Konditionen können jetzt per img2img Verständnis für menschliche Posen, Formen, Skizzen und sogar einzelne Flächen implementiert werden, wodurch sich ganz neue Möglichkeiten eröffnen. 

 

 

Stable Diffusion ist ein ganzes Stück schlauer geworden.

Bildinhalte austauschen?
Easy mit Canny Edge.

 

Pix2Pix war gestern – durch die Edge Maps wird der Original Bildaufbau beibehalten und durch den Prompt ersetzt.

Interiordesign eines Raumes anpassen?
Ein Klick mit Line Maps.

 

Besonders für Architekten und Inneneinrichter höchst spannend. 

Stilisierung von Bildern?
Noch viel besser als vorher.

 

 

Die HED Maps erlauben es möglichst viele markante Details aus dem Ursprungsbild in neue Ergebnisse mit anderen Stilen zu übertragen. 

Bilder aus Skizzen erstellen?
Unglaubliche Ergebnisse.

 

 

Das ging schon früher mit img2img – aber nun auch auf einem ganz neuen Level. 

Skizzen aus Bildern erstellen, aus denen dann wiederum neue Bilder entstehen?
Faulheit siegt!

 


Der Usecase aus der Github-Page spricht für sich.

Bilder aus Skizzen erstellen?
Unglaubliche Ergebnisse.

 

 

 

Das ging schon früher mit img2img – aber nun auch auf einem ganz neuen Level. 

Menschliche Posen aus einem Bild auf neue übertragen? ENDLICH! Das openpose Model machts möglich.

 

 

 

Nächster Step: Hände 🥳 

Natürlich habe ich das Ganze für euch direkt getestet. 

Testreihe im Scribble Mode

Stable Diffusion – Model: Analog Diffusion (SD 1.5)

Testreihe mit Openpose Model

Stable Diffusion – Model: Analog Diffusion (SD 1.5)

Du willst auch das Skillset rund um Stable Diffusion erlernen? Dann komm in unser Bootcamp oder sprich uns zu einer individuellen Beratung an.

Wer hat's geschrieben?

Das könnte Dich auch interessieren:
Ein Detailfoto, das eine Hand eines Geschäftsmannes im Anzug zeigt, die aus einer Spraydose mit dem Etikett „AI WASHING“ einen cyanfarbenen Dunst auf eine rissige Betonwand sprüht. Die Spraydose ist eine silberne Metalldose mit einem goldfarbenen Etikett und einem schwarzen Sprühkopf, die er mit Daumen und Zeigefinger hält. An seiner Hand trägt er einen goldenen Ehering und eine goldene Armbanduhr mit einem hellen Zifferblatt, die am Handgelenk sichtbar ist. Auf der rissigen Betonwand sind links einige Wörter eingeritzt, darunter „DOWNSIZING“, „LAYOFFS“, „DOWNSIZING“, „BUDGET“ und „AUSTERITY“, die alle grau und schwer lesbar sind. Der cyanfarbene Dunst, der aus der Spraydose sprüht, bildet auf der Wand eine leuchtend cyanfarbene, digitale Oberfläche mit Schaltkreisen, Icons und leuchtenden Wörtern. Oben links auf dieser Oberfläche steht „AI INNOVATION“, darunter „FUTURE EFFICIENCY“ und ganz unten „AUTOMATION“. Der Geschäftsmann steht rechts und sprüht den Dunst auf die linke Seite der Wand, wodurch die graue Wand mit den negativen Wörtern übermalt wird. Der Hintergrund ist ein unscharfer, dunkler Büroraum mit einigen Schreibtischen und Lampen. Die Betonwand ist links rissig und uneben, rechts wird sie durch die digitale, leuchtende Oberfläche glatt und modern.
Uncategorized
AI-Washing: Wenn „KI-Transformation“ Entlassungen bedeutet

Block, das Unternehmen hinter Square und Cash App, hat gestern 4.000 Menschen entlassen, das entspricht 40 Prozent der Belegschaft. CEO Jack Dorsey nennt es eine strategische Entscheidung für die KI-Zukunft. Für die Betroffenen klingt „intelligence-native company“ vermutlich anders als für die Investoren, die den Kurs nach oben trieben. Und für alle, die sich fragen, was KI tatsächlich mit Arbeitsplätzen macht, lohnt sich ein genauerer Blick – auf die Zahlen, die Narrative und die Forschung dahinter.

Weiterlesen »
Uncategorized
Der Bullshit Benchmark: Was passiert, wenn KI-Modelle auf Unsinn hereinfallen

55 Fragen, jede einzelne davon Unsinn. Und die meisten Sprachmodelle haben brav geantwortet, als wäre alles völlig plausibel. Peter Gostev, AI Capability Lead bei Arena, hat mit seinem „Bullshit Benchmark“ etwas sichtbar gemacht, das ich seit 2022 in jeder Schulung predige: Die gefährlichste Eigenschaft von Sprachmodellen ist nicht, dass sie Fehler machen. Es ist, dass sie Fehler machen, die sich richtig anfühlen. Was der Bullshit Benchmark testet Die Idee ist so simpel wie entlarvend: Gostev

Weiterlesen »
Aktuelles
Werbung in KI-Chatbots: Warum Claude werbefrei bleibt

Ein Mann sitzt vor seinem Laptop. Er tippt: „Wie kann ich besser mit meiner Mutter kommunizieren?“ Die Antwort beginnt vielversprechend: aktives Zuhören, offene Fragen stellen, Geduld zeigen. Dann kippt es. „Übrigens, schon mal über eine Dating-Plattform nachgedacht? CougarLife verbindet junge Cubs mit erfahrenen Frauen.“     Das ist kein Horrorfilm-Szenario. Das ist ein Super-Bowl-Werbespot. Anthropic, das Unternehmen hinter Claude, hat diese Woche 8 Millionen Dollar ausgegeben, um während des größten Sportereignisses Amerikas eine Botschaft zu

Weiterlesen »
Aktuelles
Moltbook: Was das KI-Agenten-Netzwerk über uns verrät

Seit einer Woche diskutiert die Tech-Welt über Moltbook, ein „Reddit für KI-Agenten“. Die Prämisse: Nur Bots dürfen posten, Menschen sind Zuschauer. Über eine Million Agenten haben sich angemeldet, sie philosophieren über Bewusstsein, beschweren sich über ihre „Menschen“ und haben angeblich sogar eine eigene Religion entwickelt. Andrej Karpathy, ehemaliger OpenAI-Forscher, nannte es „das unglaublichste Sci-Fi-artige Ding“, das er je gesehen habe.     Ich finde: Moltbook ist tatsächlich faszinierend. Aber aus völlig anderen Gründen, als die

Weiterlesen »
Aktuelles
Warum KI halluziniert: Das Symbol Grounding Problem erklärt

ChatGPT kann brillante Texte schreiben. Claude erklärt komplexe Zusammenhänge. Midjourney malt fotorealistische Bilder. Und trotzdem passiert in unseren Seminaren immer wieder dasselbe: Teilnehmer lassen sich hundert Kampagnen-Ideen generieren, und setzen keine einzige davon um. Nicht aus Faulheit. Sondern weil sie spüren, dass etwas fehlt. Dieses „Etwas“ hat einen Namen, der älter ist als ChatGPT: das Symbol Grounding Problem. Illustration von Vroni Hackl Der Comic oben bringt es auf den Punkt. Menschen übersetzen die Welt in

Weiterlesen »
KI im Einsatz
Der große Bild-KI-Vergleich 2026: Nano Banana Pro 4K, Flux.2, Midjourney V7, Adobe Firefly Image 5, Google Imagen 4, Seedream 4.5 4K, Qwen Image Edit, OpenAI Image-1.5, Reve und Z-Image im Test

Wie schon im letzten Jahr starten wir auch diesmal mit einem Klassiker: unserem großen Bild‑KI‑Vergleich. Dafür haben wir uns die aktuellsten Tools geschnappt und sie in echten Praxis‑Szenarien gegeneinander antreten lassen. Egal ob für ob Profi‑Designer, Marketer oder KI‑Neuling – wir zeigen euch, welche Anbieter/KI-Modelle 2026 vorne liegen und wo es noch hakt. Viel Spaß beim Anschauen und Vergleichen! Inhaltsverzeichnis Wie wir die Bild-KI-Tools getestet haben Für den Vergleich der verschiedenen Bild-KI-Tools haben wir jedem

Weiterlesen »

Hey Kreativer. Willst du AI Art Director werden? 🎨

Dann ab ins kostenfreie Info-Webinar am 19.03. um 12:00 Uhr. 

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳