Neues Charakter-Referenz-Feature cref von Midjourney getestet: Die Lösung für konsistente Charaktere und virtuelle Avatare?

Inhaltsverzeichnis

Die Generierung konsistenter Charaktere war bisher ein komplexes Thema, das sich nur über Stable Diffusion mit dem Training von LoRas, Checkpoints oder der Nutzung von IP Adapter abbilden ließ. Nerdig und schwer zugänglich. Aber jetzt stößt Midjourney zur Party dazu und hat seine eigene Form der Referenzierung über IP Adapter mitgebracht. In diesem Beitrag teste ich das Feature aus einer ganz eigenen Brille: Von jemandem, der damit beauftragt wird, solche künstlichen Avatare zu erschaffen. Challenge accepted!

Wie funktioniert das neue "cref" Feature von Midjourney?

Das Charakter-Referenz-Feature, kurz „cref“, ermöglicht es Nutzer:innen, eigene oder fremde Bilder als Referenz für die Erstellung neuer, einzigartiger Charaktere zu verwenden. Diese Technologie bietet unglaubliche Möglichkeiten, insbesondere in der Welt der virtuellen Avatare und digitalen Kunst.

Um das Feature zu nutzen, fügt ihr den Parameter –cref an euren Prompt an und gebt dahinter eine Bild-URL als Referenz an. Wie das geht zeige ich im folgenden Video:

Hier ein kurzes Tutorial-Video zur Nutzung von cref in Midjourney:

Gewichtung von --cref über --cw nutzen:

Um die Gewichtung der Referenz zu steuern, könnt ihr zusätzlich den Wert „cref weight“ (–cw) nutzen: 

  • –cw 100 (Standardwert): Hierbei wird alles als Referenz genutzt: Gesicht, Haare, Kleidung
  • –cw 50 (Mittelwert): Hier werden Teile aus der Referenz genutzt: z.B. Gesicht und Haare 
  • –cw 0 (Minimalwert): Hier wird nur das Gesicht als Referenz genutzt und der Rest variiert.

Natürlich könnt ihr auch auch alle Werte dazwischen nutzen.

Beispiel-Prompt:

/imagine Photo Type: portrait, 50mm photograph, Canon EOS R3, 4k, highly detailed, Subject Focus: 30 year old woman from Berlin, business clothing, shoulder length wavy pink hair, round glasses, brown eyes, happy, Color Tone: natural, Setting: office space background, Atmosphere: professional, Texture: film grain:2, Mood: happy, Composition: bokeh, Lighting: natural lighting –ar 4:5 –style raw –v 6.0 –cref https://bildurl.com/beispiel.png –cw 100

Was taugt das neue cref Feature von Midjourney?

Um das neue Feature für mich, KundInnen und KursteilnehmerInnen zu testen, habe ich das System auf zwei Arten getestet und schließlich noch gegen Stable Diffusion antreten lassen. 

Fremde Referenzen

Zunächst habe ich mit einem Bild experimentiert, das ich mit Stable Diffusion generiert habe. Durch Anpassen des „cref weight“ (–cw) konnte ich steuern, wie stark das Originalbild als Referenz herangezogen wird. Die Ergebnisse variierten je nach Einstellung erheblich, allerdings war die Ähnlichkeit zum Original nicht so konsistent, wie ich es mir gewünscht hatte.

Referenzbild – generiert mit Stable Diffusion
--cw 100
--cw 50
--cw 0
--cw 50 und in Interaktion gepromptet

Eigene Referenzen

Anschließend habe ich ein Bild verwendet, das von Midjourney selbst generiert wurde. Hier sind die Ergebnisse deutlich konsistenter, obwohl immer noch einige Abweichungen, beispielsweise bei Augenbrauen oder Gesichtsform, zu beobachten sind.

Referenzbild – generiert mit Midjourney
--cw 100
--cw 50
--cw 0
--cw 50 und in Interaktion gepromptet

Vergleich mit Stable Diffusion ohne Finetuning/Training

Ohne jegliches Feintuning oder Training konnte ich mithilfe eines speziell entwickelten Prompts einen relativ konsistenten virtuellen Avatar einer 30-jährigen Frau erschaffen. Dies zeigt ganz gut das Potenzial auch ohne aufwendiges Training.

Stable Diffusion mit IP Adapter

Jetzt simulieren wir die Technik hier Midjourney cref mit Stable Diffusion und nutzen ControlNet mit dem IP Adapter Plus Face SDXL. Das Ergebnis zeigt eine ähnliche Wirkung und ist ohne tiefere Einstellung der Parameter mit –cw 0. Es werden Details übernommen, aber nicht genug um eine 100%ig Ähnlichkeit zum Original zu gewährleisten. 

Referenzbild – generiert mit Stable Diffusion

Fazit

Das neue „cref“-Feature von Midjourney ist eine gute Ergänzung für alle, die im Bereich der digitalen Charaktererstellung tätig sind. Besonders beeindruckend ist die Leistungsfähigkeit des Features, wenn es mit von Midjourney generierten Bildern als Referenz arbeitet. Für Anwendungen, bei denen eine oberflächliche Wiedererkennbarkeit ausreicht, bietet es eine überzeugende Lösung. Dennoch gibt es Raum für Verbesserungen, insbesondere wenn es um die feine Abstimmung und die Konsistenz der generierten Bilder geht.

Wer stark Ähnlichkeit und mehr Flexibilität benötigt, kommt derzeit um ein Finetuning/Training für Stable Diffusion nicht herum. Hier kann man je nach Anforderung über das Training eines LoRas oder eines finegetunten Checkpoints nachdenken. Auf Grund der Flexibilität rate ich zum Checkpoint, da diese erfahrungsgemäß deutlich flexibler sind als LoRas. 

Du willst generative KI für Marketing und Kreation lernen?

In unserem KI Marketing Bootcamp nehmen wir dich an die Hand und erklären dir die Basics und das Hintergrundwissen dazu. Wir schulen Einzelpersonen oder auch ganze Abteilungen in unseren individuellen Unternehmens Bootcamps. Sprich uns einfach an und wir finden die passende Form für Dich.

Das könnte Dich auch interessieren:
Aktuelles
Warum KI Weiterbildung jetzt? Skepsis als gesunder Kompass

Stell Dir vor, es ist 2019, und jemand sagt Dir, dass in fünf Jahren die Hälfte aller Marketingprofis täglich mit Künstlicher Intelligenz arbeitet. Hättest Du das geglaubt? Wahrscheinlich nicht. Doch genau das ist heute Realität: KI-Tools wie ChatGPT, Microsoft Copilot und viele mehr prägen unseren Arbeitsalltag zunehmend.   Dabei schwanken viele von uns zwischen Begeisterung und Überforderung: Wie nutze ich KI sinnvoll? Wie positioniere ich mich und mein Team im digitalen Wandel? Genau hier setzt

Weiterlesen »
KI im Einsatz
KI Weiterbildung im Marketing: Spezialisierte Online-Kurse des KI Marketing Bootcamps

KI Weiterbildung: KI Marketing Bootcamp startet spezialisiertes Kursangebot für Marketing-Profis   Erbendorf, 12. September 2025 – Das KI Marketing Bootcamp stellt sein Angebot neu auf und startet spezialisierte KI Weiterbildungen, auch in Kooperation mit der IHK. Das Schulungshaus reagiert damit auf den klaren Bedarf des Marktes nach tiefgehendem Fachwissen anstelle von allgemeinen Überblicken. Die neuen, praxisnahen Online-Kurse sind exakt auf die unterschiedlichen Rollen im modernen Marketing zugeschnitten. Ab sofort buchbar sind die Formate AI Content

Weiterlesen »
KI im Einsatz
Die Zukunft der KI in Europa spricht Schweizerdeutsch: APERTUS

Hoi zäme! Während vielerorts noch darüber diskutiert wird, ob KI besser abgeschottet oder komplett transparent sein soll, haben die Schweizer Forschenden einen klaren Weg eingeschlagen: Sie setzen auf Offenheit. Mit APERTUS stellen ETH Zürich, EPFL und CSCS ein neues mehrsprachiges Sprachmodell vor, das Open Source verfügbar sit. Sie setzen damit ein starkes Signal für vertrauenswürdige KI in Europa. Das Modell kann wirklich frei ausprobiert, heruntergeladen und für beliebige Zwecke eingesetzt werden, sei es zum Experimentieren

Weiterlesen »
KI im Einsatz
Content Marketing mit KI – Das Buch von Vroni & Georg

Es ist da! Nach Monaten intensiver Arbeit haben Georg und Vroni ihr neues Buch veröffentlicht: Content Marketing mit KI. Ab sofort erhältlich bei Amazon und Thalia. Warum das wichtig ist? Weil Content Marketing aktuell seinen „Epic Split“ erlebt – zwischen kreativer Authentizität und der Notwendigkeit, Content immer schneller und effizienter zu produzieren. Genau hier setzt das Buch an: Es zeigt, wie du generative KI nicht als Hype-Tool verstehst, sondern als praxisnahen Begleiter für echte Wirkung

Weiterlesen »
KI im Einsatz
Nano Banana aka Gemini 2.5 Flash Image schlägt Wellen im Internet – und das völlig zu Recht!

Was hinter den mysteriösen drei Bananen-Emojis von Googles CEO steckte, hat sich endlich als eine der spannendsten Entwicklungen in der KI-Bildbearbeitung entpuppt. Nano Banana, offiziell bekannt als Gemini 2.5 Flash Image, verändert gerade die Art, wie wir Bilder bearbeiten. Inhaltsverzeichnis Was ist Nano Banana eigentlich?   Kennst du das Gefühl, wenn du ein Foto hast und denkst: „Wenn ich nur dieses eine Detail ändern könnte…“? Genau hier kommt Nano Banana ins Spiel – und nein,

Weiterlesen »
KI im Einsatz
WAN 2.2 schlägt Flux bei LoRAs klar

Georg war schon beim ersten Test von WAN 2.2 fasziniert. Wir hatten das Modell im KI Marketing Bootcamp bereits für Bild- und Videogenerierung ausprobiert – und die Resultate waren beeindruckend. Die Highlights dieser Tests haben wir bereits in zwei separaten Blogbeiträgen festgehalten:   Unser Video-Blogbeitrag zu WAN 2.2 → Unser Bild-Blogbeitrag zu WAN 2.2 →   Doch diesmal hat Georg den nächsten Schritt gewagt: Er hat mit WAN 2.2 sein ganz eigenes LoRA trainiert. Das

Weiterlesen »

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳