Bildgenerierung mit WAN 2.2: Was das Open Source Modell drauf hat

Wenn du gerade von unserem WAN 2.2 Video‑Blogbeitrag kommst, weißt du schon, was dich erwartet.
Wenn nicht – kein Problem. Hier bekommst du den zweiten Teil unseres Tests. Diesmal geht’s um die Bildgenerierung mit WAN 2.2, und die ist – kein Witz – richtig stark.

Warum? Weil WAN 2.2 nicht nur in der Videogenerierung überzeugt, sondern auch bei Standbildern extrem abliefert: realistische Hauttöne, fotorealistisches Licht, klar definierte Materialien.

Falls du erstmal das Video sehen willst: Hier geht’s zum Beitrag →

Und jetzt viel Spaß mit dem praktischen Deep Dive in die Bildgenerierung mit WAN 2.2 – inklusive Beispielen, Setup und echten Learnings aus dem Test.

Inhaltsverzeichnis

Kurz vorgestellt: Was ist WAN 2.2?

 

WAN 2.2 ist ein generatives Modell für Video und Standbild. Für Fotos wirkt es erstaunlich „echt“: Hauttöne bleiben natürlich, Licht verhält sich plausibel und Materialien zeigen feine Texturen. Der Look ist eher neutral‑fotografisch und funktioniert deshalb für Porträt, Produkt und Interior gleichermaßen. Die Modelle stehen unter Apache 2.0 – das bedeutet breite kommerzielle Nutzungsrechte (Marken‑ und Persönlichkeitsrechte sind natürlich weiterhin zu beachten). In der Praxis arbeiten wir dafür am liebsten mit ComfyUI.

So nutzt du WAN 2.2 mit ComfyUI:

 

Du brauchst lediglich ComfyUI, die WAN 2.2‑Modelle und einen fertigen Workflow. Installiere ComfyUI, lade die Modelldateien von der offiziellen WAN‑Seite und öffne anschließend unseren Text‑to‑Image-Workflow per Drag‑&‑Drop. Tipp: Starte mit einer moderaten Bildgröße, zum Beispiel 1024 px Kantenlänge, und erhöhe danach schrittweise.

 

 

ComfyUI sucht Modelle in Unterordnern wie models/unet/, models/vae/ und models/text_encoders/. Für die großen 14B‑Modelle brauchst du High‑Noise und Low‑Noise – so erhältst du stabile Formen und feine Details. 

Showcase: Was alles möglich ist

<nerdmodus>
Unsere Bildtestreihe entstand mit ComfyUI und dem oben verlinkten Workflow und Settings. Erstes Sampling mit dem High Noise Model, das zweite mit Low Noise. Durch diese Kombination entstehen Bilder, die beim Thema Detailreichtum und Korrektheit von Details seines Gleichen suchen.

Generiert wurden die Bilder mit einer Auflösung von 1440×1800 Pixel – und jetzt kommts: Jedes Bild braucht dabei in diesen Settings 8 Minuten auf einer RTX 6000 Ada. Gerade beim Thema Performance ist noch Luft nach oben – aber die Open Source Community arbeitet bereits daran und verfolgt gerade verschiedene Ansätze mit Lightning LoRAs, Sageattention-Optimierung und anderen innovativen Workflows. Auch die Kombination aus Qwen Image für ersten Sampling Step und zweitem Sampling-Step mit WAN 2.2 Low Noise sieht bisher vielversprechend aus. 

</nerdmodus>

1) Porträtfotografie – natürlich & detailliert

 

WAN 2.2 kann Haut glaubwürdig wiedergeben. Nutze weiches Fensterlicht oder eine große Softbox und bleib beim Stil sparsam.

2) Lifestyle & Performance

3) Interior & Architektur

4) Natur, Landschaft & Luftaufnahmen

5) Makro & Material

6) Sci-Fi, Space & Concept

7) Illustration, Branding & Grafik

Heads-up: Georgs LoRA Experimente auf Basis von WAN 2.2 liefern auffallend konsistente Porträts. Nächstes Mal verraten wir Training, Prompt-Rezepte und Best Practices. (Link folgt)

Unser Expertenfazit

 

WAN 2.2 setzt in der reinen Bildgenerierung ein starkes Zeichen: Porträts überzeugen mit natürlicher Haut und glaubwürdigen Catchlights, Produkte zeigen saubere Kanten und kontrollierte Reflexe, Materialien wirken dank klarer Mikrostruktur sehr real. Der neutrale Fotolook macht die Ergebnisse vielseitig einsetzbar – vom Webshop bis zum Editorial. Die Kehrseite: Die großen Modelle sind rechenintensiv und fühlen sich aktuell am besten in ComfyUI an. Wer sofort testen möchte, lädt die WAN‑Modelle von der offiziellen Seite (Modelle & Beispiele → https://comfyanonymous.github.io/ComfyUI_examples/wan22/) und öffnet unseren Text‑to‑Image‑Workflow per Drag‑&‑Drop (Workflow → https://marketing-ki.de/wp-content/uploads/2025/08/Wan2.2_Text-To-Image.json). Einmal starten, mit moderater Auflösung beginnen – fertig.

Unsere Schulungsangebote

 

Wir arbeiten gerade an einer neuen Ausbildung zum Diffusion Engineer. Wenn du also richtig tief abgeholt werden willst, melde dich schonmal vorab per Email. Bis dahin bieten wir individuelle Unternehmens-Seminare an, bei denen wir auch ComfyUI Schulungen für ganze Design- und Marketingteams durchführe. Wenn du also wissen willst wie man mit WAN 2.2 eigene Bilder produzieren, können wir für dich und deine Abteilung ein individuelles Seminar konzipieren. Die Erfahrungen aus 100+ Seminaren in deutschen Organisationen lügen nicht. Hier findest du alle Infos und Anfragemöglichkeiten zu unseren individuellen KI Fortbildungen und Seminaren für Unternehmen.

 

Fazit

 

WAN 2.2 bringt Standbilder sehr nah an professionelle Fotografie: natürliche Haut, plausibles Licht, saubere Kanten und feine Mikrotexturen – bei einem neutralen, gut steuerbaren Look. Porträt, Produkt, Material, Interior, Food und Makro gelingen mit wenigen, klaren Angaben zu Licht, Optik (z. B. 35 mm, geringe Schärfentiefe) und Material.

 

Für die Praxis heißt das: Mit ComfyUI und unserem Workflow kommst du schnell (Zeit ist relativ) vom Prompt zur Datei; dank Apache 2.0 sind die Ergebnisse auch kommerziell nutzbar (Rechte Dritter beachten). Und falls du Setup, Qualität oder Tempo ausreizen willst, unterstützen wir dich gern mit Schulungen.

Bereit für den nächsten Schritt?

 

Die Tools entwickeln sich schnell, und jedes hat seine Besonderheiten.

 

Im KI Marketing Bootcamp gehen wir systematisch vor: Von der Strategie über die Tool-Auswahl bis zur konkreten Umsetzung. Du lernst nicht nur die Theorie, sondern arbeitest an echten Projekten – mit direktem Feedback und praktischen Workflows, die du sofort einsetzen kannst.

 

Was erwartet dich?

  • Praxisorientierte Anleitungen: Lerne, wie du KI-Tools strategisch einsetzt und das Beste aus ihnen herausholst

  • Erprobte Workflows: Vom Konzept bis zur Umsetzung – mit sofort anwendbaren Strategien

  • Individuelle Begleitung: Kleine Gruppen und persönliche Betreuung bei deinen Projekten

Deine Vorteile:

  • Learning by Doing: Entwickle eigene Kampagnen, die auf deine spezifischen Ziele zugeschnitten sind

  • Praxiswissen: Nutze echte Beispiele und Erfolgsstrategien für deine eigenen Projekte

  • 100% Online: Flexibel lernen, wann es in deinen Zeitplan passt

Für Unternehmen: Maßgeschneiderte Workshops für dein Marketing-Team.

Dein Expertenteam: Vroni Hackl und Georg Neumann – dein Expertenteam und deine Guides durch KI im Marketing.

Vroni forscht zu Sprachmodellen, Georg trainiert seit 2022 Bild-KI Modelle

Über den Author

Das könnte Dich auch interessieren:
Aktuelles
Moltbook: Was das KI-Agenten-Netzwerk über uns verrät

Seit einer Woche diskutiert die Tech-Welt über Moltbook, ein „Reddit für KI-Agenten“. Die Prämisse: Nur Bots dürfen posten, Menschen sind Zuschauer. Über eine Million Agenten haben sich angemeldet, sie philosophieren über Bewusstsein, beschweren sich über ihre „Menschen“ und haben angeblich sogar eine eigene Religion entwickelt. Andrej Karpathy, ehemaliger OpenAI-Forscher, nannte es „das unglaublichste Sci-Fi-artige Ding“, das er je gesehen habe.     Ich finde: Moltbook ist tatsächlich faszinierend. Aber aus völlig anderen Gründen, als die

Weiterlesen »
Aktuelles
Warum KI halluziniert: Das Symbol Grounding Problem erklärt

ChatGPT kann brillante Texte schreiben. Claude erklärt komplexe Zusammenhänge. Midjourney malt fotorealistische Bilder. Und trotzdem passiert in unseren Seminaren immer wieder dasselbe: Teilnehmer lassen sich hundert Kampagnen-Ideen generieren, und setzen keine einzige davon um. Nicht aus Faulheit. Sondern weil sie spüren, dass etwas fehlt. Dieses „Etwas“ hat einen Namen, der älter ist als ChatGPT: das Symbol Grounding Problem. Illustration von Vroni Hackl Der Comic oben bringt es auf den Punkt. Menschen übersetzen die Welt in

Weiterlesen »
KI im Einsatz
Der große Bild-KI-Vergleich 2026: Nano Banana Pro 4K, Flux.2, Midjourney V7, Adobe Firefly Image 5, Google Imagen 4, Seedream 4.5 4K, Qwen Image Edit, OpenAI Image-1.5, Reve und Z-Image im Test

Wie schon im letzten Jahr starten wir auch diesmal mit einem Klassiker: unserem großen Bild‑KI‑Vergleich. Dafür haben wir uns die aktuellsten Tools geschnappt und sie in echten Praxis‑Szenarien gegeneinander antreten lassen. Egal ob für ob Profi‑Designer, Marketer oder KI‑Neuling – wir zeigen euch, welche Anbieter/KI-Modelle 2026 vorne liegen und wo es noch hakt. Viel Spaß beim Anschauen und Vergleichen! Inhaltsverzeichnis Wie wir die Bild-KI-Tools getestet haben Für den Vergleich der verschiedenen Bild-KI-Tools haben wir jedem

Weiterlesen »
KI im Einsatz
Kinderbuch mit KI erstellen – so einfach gehts 2026

Live-Webinar-Alarm: Du liest gerade den Prozess zu Mathildas Buch, aber willst du Georg auch mal live über die Schulter schauen? Am 19.02. um 12:00 Uhr zeigen Georg & Vroni dir im kostenlosen Webinar die exakten Workflows und wie du Charakter-Konsistenz heute in Sekunden schaffst.    Hier klicken & kostenlos anmelden (inkl. Goodies!) Alle Jahre wieder… kommt nicht nur das Christkind, sondern auch ein neues Mathilda-Buch. Was als kleines Experiment begann, ist mittlerweile eine feste Tradition

Weiterlesen »
Aktuelles
Vibecoding: Wie wir 24 Web-Apps bauten, ohne programmieren zu können (und was du daraus lernst)

Update: Unser Adventskalender für 2025 ist leider schon vorbei, aber keine Sorge: im Dezember 2026 geht’s wieder los! 🎄✨ Wir sind Marketer. Wir sind Konzepter. Wir sind keine Software-Entwickler. Trotzdem haben wir dieses Jahr einen voll funktionsfähigen, interaktiven Online-Adventskalender gelauncht, der statt Schoki echte Browser-Apps, Spiele und allerhand anderes enthält.   Wie das geht? Mit einer Methode, die „Vibecoding“ genannt wird. Hier ist unser Werkstattbericht und warum dieses Experiment mehr ist als nur eine Spielerei.  

Weiterlesen »
Aktuelles
Happy Neural New Year 2025! ChatGPT feiert Geburtstag

Wir haben es einfach mal getan: Einen neuen Feiertag ins Leben gerufen.   30. November: Happy Neural New Year.   Vor genau drei Jahren wurde ChatGPT gelauncht. Nach zwei Monaten hatte das Tool schon die Schallmauer von 100 Millionen Nutzer:innen durchbrochen. Und so manchen User verblüfft, oder mindestens ordentlich ins Grübeln gebracht.   Und ja, jetzt stehen wir hier. Wir nutzen KI alltäglich, als hätte es nie etwas anderes gegeben.  Inhaltsverzeichnis Was war eigentlich dein

Weiterlesen »

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳