Neues Charakter-Referenz-Feature cref von Midjourney getestet: Die Lösung für konsistente Charaktere und virtuelle Avatare?

Inhaltsverzeichnis

Die Generierung konsistenter Charaktere war bisher ein komplexes Thema, das sich nur über Stable Diffusion mit dem Training von LoRas, Checkpoints oder der Nutzung von IP Adapter abbilden ließ. Nerdig und schwer zugänglich. Aber jetzt stößt Midjourney zur Party dazu und hat seine eigene Form der Referenzierung über IP Adapter mitgebracht. In diesem Beitrag teste ich das Feature aus einer ganz eigenen Brille: Von jemandem, der damit beauftragt wird, solche künstlichen Avatare zu erschaffen. Challenge accepted!

Wie funktioniert das neue "cref" Feature von Midjourney?

Das Charakter-Referenz-Feature, kurz „cref“, ermöglicht es Nutzer:innen, eigene oder fremde Bilder als Referenz für die Erstellung neuer, einzigartiger Charaktere zu verwenden. Diese Technologie bietet unglaubliche Möglichkeiten, insbesondere in der Welt der virtuellen Avatare und digitalen Kunst.

Um das Feature zu nutzen, fügt ihr den Parameter –cref an euren Prompt an und gebt dahinter eine Bild-URL als Referenz an. Wie das geht zeige ich im folgenden Video:

Hier ein kurzes Tutorial-Video zur Nutzung von cref in Midjourney:

Gewichtung von --cref über --cw nutzen:

Um die Gewichtung der Referenz zu steuern, könnt ihr zusätzlich den Wert „cref weight“ (–cw) nutzen: 

  • –cw 100 (Standardwert): Hierbei wird alles als Referenz genutzt: Gesicht, Haare, Kleidung
  • –cw 50 (Mittelwert): Hier werden Teile aus der Referenz genutzt: z.B. Gesicht und Haare 
  • –cw 0 (Minimalwert): Hier wird nur das Gesicht als Referenz genutzt und der Rest variiert.

Natürlich könnt ihr auch auch alle Werte dazwischen nutzen.

Beispiel-Prompt:

/imagine Photo Type: portrait, 50mm photograph, Canon EOS R3, 4k, highly detailed, Subject Focus: 30 year old woman from Berlin, business clothing, shoulder length wavy pink hair, round glasses, brown eyes, happy, Color Tone: natural, Setting: office space background, Atmosphere: professional, Texture: film grain:2, Mood: happy, Composition: bokeh, Lighting: natural lighting –ar 4:5 –style raw –v 6.0 –cref https://bildurl.com/beispiel.png –cw 100

Was taugt das neue cref Feature von Midjourney?

Um das neue Feature für mich, KundInnen und KursteilnehmerInnen zu testen, habe ich das System auf zwei Arten getestet und schließlich noch gegen Stable Diffusion antreten lassen. 

Fremde Referenzen

Zunächst habe ich mit einem Bild experimentiert, das ich mit Stable Diffusion generiert habe. Durch Anpassen des „cref weight“ (–cw) konnte ich steuern, wie stark das Originalbild als Referenz herangezogen wird. Die Ergebnisse variierten je nach Einstellung erheblich, allerdings war die Ähnlichkeit zum Original nicht so konsistent, wie ich es mir gewünscht hatte.

Referenzbild – generiert mit Stable Diffusion
--cw 100
--cw 50
--cw 0
--cw 50 und in Interaktion gepromptet

Eigene Referenzen

Anschließend habe ich ein Bild verwendet, das von Midjourney selbst generiert wurde. Hier sind die Ergebnisse deutlich konsistenter, obwohl immer noch einige Abweichungen, beispielsweise bei Augenbrauen oder Gesichtsform, zu beobachten sind.

Referenzbild – generiert mit Midjourney
--cw 100
--cw 50
--cw 0
--cw 50 und in Interaktion gepromptet

Vergleich mit Stable Diffusion ohne Finetuning/Training

Ohne jegliches Feintuning oder Training konnte ich mithilfe eines speziell entwickelten Prompts einen relativ konsistenten virtuellen Avatar einer 30-jährigen Frau erschaffen. Dies zeigt ganz gut das Potenzial auch ohne aufwendiges Training.

Stable Diffusion mit IP Adapter

Jetzt simulieren wir die Technik hier Midjourney cref mit Stable Diffusion und nutzen ControlNet mit dem IP Adapter Plus Face SDXL. Das Ergebnis zeigt eine ähnliche Wirkung und ist ohne tiefere Einstellung der Parameter mit –cw 0. Es werden Details übernommen, aber nicht genug um eine 100%ig Ähnlichkeit zum Original zu gewährleisten. 

Referenzbild – generiert mit Stable Diffusion

Fazit

Das neue „cref“-Feature von Midjourney ist eine gute Ergänzung für alle, die im Bereich der digitalen Charaktererstellung tätig sind. Besonders beeindruckend ist die Leistungsfähigkeit des Features, wenn es mit von Midjourney generierten Bildern als Referenz arbeitet. Für Anwendungen, bei denen eine oberflächliche Wiedererkennbarkeit ausreicht, bietet es eine überzeugende Lösung. Dennoch gibt es Raum für Verbesserungen, insbesondere wenn es um die feine Abstimmung und die Konsistenz der generierten Bilder geht.

Wer stark Ähnlichkeit und mehr Flexibilität benötigt, kommt derzeit um ein Finetuning/Training für Stable Diffusion nicht herum. Hier kann man je nach Anforderung über das Training eines LoRas oder eines finegetunten Checkpoints nachdenken. Auf Grund der Flexibilität rate ich zum Checkpoint, da diese erfahrungsgemäß deutlich flexibler sind als LoRas. 

Du willst generative KI für Marketing und Kreation lernen?

In unserem KI Marketing Bootcamp nehmen wir dich an die Hand und erklären dir die Basics und das Hintergrundwissen dazu. Wir schulen Einzelpersonen oder auch ganze Abteilungen in unseren individuellen Unternehmens Bootcamps. Sprich uns einfach an und wir finden die passende Form für Dich.

Das könnte Dich auch interessieren:

KI im Einsatz

FLUX.1 Tools: Die neue KI-Toolbox für präzise Bildbearbeitung

Generative KI erreicht mit den neuen FLUX.1 Tools einen weiteren Meilenstein in der präzisen Bildbearbeitung. Das Freiburger Start-up Black Forest Labs, bekannt durch seinen beeindruckenden Bildgenerator FLUX.1, stellt nun vier spezialisierte Werkzeuge vor, die das kreative Arbeiten mit KI jetzt viel flexibler machen. Die Tools – Fill, Depth, Canny und Redux – erweitern die Möglichkeiten der Bildmanipulation erheblich und sind sowohl als Open-Source-Variante für Entwickler als auch als Pro-Version über die API verfügbar. Besonders spannend

Weiterlesen »
KI im Einsatz

VDMB Jahresmagazin 2024: So haben wir die Bilder generiert

Manchmal entwickeln sich aus einem Workshop ganz besondere Projekte. So geschehen nach einer KI-Schulung in der VDMB Akademie, als die Anfrage kam, für das VDMB Jahresmagazin 2024 die Autorenportraits mittels künstlicher Intelligenz zu erstellen. Eine spannende Aufgabe, die nicht nur die Portraits der Autoren betraf, sondern auch in einem vierseitigen Interview über die Möglichkeiten von KI im Printbereich mündete. In diesem Artikel zeige ich dir, wie wir die KI-generierten Portraits für das Magazin entwickelt haben.

Weiterlesen »
KI im Einsatz

Flux LoRa Training: Freepik und krea.ai haben eure Daten zum Fressen gern

KI-generierte Bilder sind in aller Munde, und immer mehr Menschen möchten ihre eigenen KI-Modelle (LoRAs) trainieren. Sowohl krea.ai als auch Freepik bieten dafür benutzerfreundliche Services an, die das mittels Flux ermöglichen – doch was passiert eigentlich mit den Bildern, die man zum Training hochlädt? Ein genauer Blick in die Nutzungsbedingungen offenbart, dass beide Plattformen sich weitreichende Rechte an den hochgeladenen Inhalten sichern. Während Freepik zumindest die Nutzung für KI-Training ausschließt, behält sich krea.ai praktisch alle

Weiterlesen »
KI im Einsatz

Recraft V3: wie schlägt sich Red Panda gegen Midjourney und Flux?

Recraft V3, vormals als „Red Panda“ bekannt, setzt einen neuen Standard in der Text-zu-Bild-KI. Entwickelt vom Londoner Unternehmen Recraft unter der Leitung von KI-Expertin Anna Veronika Dorogush, kombiniert Recraft V3 beeindruckende Bildqualität mit hoher Funktionalität für professionelle Anwendungen.   Besonders für Marketing- und Designabteilungen bietet das Modell zahlreiche Vorteile: Es ermöglicht die Erstellung hochauflösender Bilder und skalierbarer Vektorgrafiken und bietet eine präzise Steuerung von Text- und Designelementen, wodurch markenkonforme Inhalte schnell und konsistent umgesetzt werden

Weiterlesen »
KI im Einsatz

Perplexity AI im Marketing nutzen: Schneller zu zuverlässigen Quellen

Du kennst das Problem: Die nächste Content-Idee steht, aber wo anfangen mit der Recherche? KI-Tools wie Perplexity AI bringen frischen Wind in den Bereich der Suchmaschinen – und das mit einem entscheidenden Vorteil: verlässliche Quellenangaben. Gerade für Marketer und Content Creator ist das ein echter Zugewinn. Perplexity ermöglicht es, in Echtzeit auf aktuelle Informationen zuzugreifen und die Quellen transparent einzusehen.   Seit letzter Woche gibt es neben Perplexity auch SearchGPT in der Pro-Version von ChatGPT

Weiterlesen »
Bootcamp

Was macht eine gute KI-Fortbildung im Marketing aus?

KI verändert das Marketing grundlegend. Aber zwischen YouTube-Tutorials und theoretischen Workshops ist es schwer, die richtige Fortbildung zu finden. Was unterscheidet also eine wirklich gute KI-Fortbildung von oberflächlichem Wissen? Inhaltsverzeichnis Was Marketer wirklich brauchen   Im modernen Marketing-Alltag sind praxisorientierte, effektive Lösungen wichtiger als theoretische technische Details. Erfolgreiche Marketer setzen heute auf intelligente KI-gestützte Strategien, die ihnen einen klaren Vorsprung verschaffen. Wenn du im Marketing spürbar vorankommen möchtest, gilt es, Zeitfresser zu automatisieren, deine Marketing-Ergebnisse

Weiterlesen »

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳