VDMB Jahresmagazin 2024: So haben wir die Bilder generiert

Georg Neumann
November 19, 2024

Manchmal entwickeln sich aus einem Workshop ganz besondere Projekte. So geschehen nach einer KI-Schulung in der VDMB Akademie, als die Anfrage kam, für das VDMB Jahresmagazin 2024 die Autorenportraits mittels künstlicher Intelligenz zu erstellen. Eine spannende Aufgabe, die nicht nur die Portraits der Autoren betraf, sondern auch in einem vierseitigen Interview über die Möglichkeiten von KI im Printbereich mündete.

In diesem Artikel zeige ich dir, wie wir die KI-generierten Portraits für das Magazin entwickelt haben. Du erfährst, welche technischen Schritte nötig waren, wie der Workflow aussah und welche Besonderheiten es bei der Umsetzung gab.

Der Auftrag: Innovation im Printbereich

Die Produktion eines hochwertigen Magazins stellt besondere Anforderungen an die visuelle Qualität. Für das VDMB Jahresmagazin 2024 wurde dabei ein innovativer Weg eingeschlagen: Statt klassischer Fotoshootings sollten die Autorenportraits mittels künstlicher Intelligenz entstehen.

Nach einem intensiven KI-Workshop in der VDMB Akademie entwickelte sich die Idee, diese Technologie direkt in der Praxis einzusetzen. Der Verband Druck und Medien Bayern wollte damit nicht nur über digitale Innovation berichten, sondern sie aktiv demonstrieren – ein Ansatz, der perfekt zur zukunftsorientierten Ausrichtung des Magazins passt.

Die Herangehensweise war dabei bewusst niederschwellig: Als Ausgangsmaterial dienten Smartphone-Aufnahmen der Autoren. Diese Fotos bildeten die Grundlage für das Training personalisierter KI-Modelle. Unser Ziel war es, hochwertige Portraits zu generieren, die sowohl den technischen Anforderungen des Printbereichs entsprechen als auch die individuellen Charakteristika der porträtierten Personen authentisch wiedergeben.

Technische Umsetzung: Von Fotos zu KI-Portraits

Der technische Kern des Projekts basierte auf Flux.1 [dev], einem spezialisierten KI-Modell für fotorealistische Portraitgenerierung. Dieses Basismodell wurde durch individuelle LoRAs (Low-Rank Adaptations) für jeden Autor personalisiert – eine Technik, die es ermöglicht, bestehende KI-Modelle gezielt auf spezifische Gesichtszüge zu trainieren.

Das Training

Für das Training nutzten wir kohya_ss, ein bewährtes Tool für die Entwicklung von LoRAs. Die Trainingsparameter wurden dabei bewusst konservativ gewählt:

4000 Trainingsschritte (Steps)
Rank 64
Learningrate von 0.000075

Diese Kombination aus hoher Schrittanzahl, hohem Rank und niedriger Learningrate hat sich als optimal für qualitativ hochwertige Ergebnisse erwiesen. Sie sorgt für eine ausgezeichnete Wiedererkennbarkeit der Personen und bietet gleichzeitig die nötige Flexibilität bei der späteren Bildgenerierung.

Die Trainingsdaten

Als Grundlage dienten pro Person 10-20 Smartphone-Aufnahmen. Diese wurden nach groben Vorgaben erstellt, um optimale Trainingsergebnisse zu gewährleisten. Wichtig waren dabei verschiedene Perspektiven, Ausschnitte, Hintergründe und Kleidung, die später eine vielseitige Generierung ermöglichten.

Der Generierungsprozess: Qualität durch Komplexität

Die eigentliche Bildgenerierung erfolgte über einen spezialisierten ComfyUI-Workflow. ComfyUI, als node-basierte Oberfläche für Bildgenerierung, ermöglichte uns dabei eine präzise Kontrolle über jeden einzelnen Parameter des Generierungsprozesses.

Technische Verfeinerung

Eine Besonderheit des Workflows war die Integration von Noise Injection – eine Technik, die durch gezieltes Hinzufügen von „Rauschen“ während der Generierung für mehr Variation und Natürlichkeit in den Ergebnissen sorgt. In Kombination mit einem zusätzlichen Realism LoRA erreichten wir eine neue Qualitätsstufe bei den generierten Portraits. Der Workflow basiert in seinen Grundzügen auf einem Workflow des kanadischen Fotografen Albert Zablit.

Für jede Person wurden etwa 360 Bilder generiert, wobei jedes Bild etwa 60 Sekunden Rechenzeit benötigte. Diese große Menge an Generierungen war notwendig, um eine optimale Auswahl für das hochwertige Printprodukt zu gewährleisten.

Nachbearbeitung und Selektion

Nach der Generierung folgte ein mehrstufiger Auswahlprozess:

Erste Sichtung und Vorauswahl der technisch besten Bilder
Detaillierte Qualitätsprüfung auf Konsistenz und Wiedererkennbarkeit
Finale Auswahl von 4-5 Bildern pro Person
Professionelle Nachbearbeitung und Upscaling für den Printbereich

Zeit- und Ressourcenaufwand: Der Weg zum perfekten Portrait

Die Erstellung hochwertiger KI-Portraits für ein Printmagazin ist ein komplexer Prozess, der sich über mehrere Phasen erstreckt. Pro Autor investierten wir etwa 5-6 Stunden Gesamtarbeitszeit, die sich wie folgt aufgliederte:

Training und Generierung

Vorbereitung und Training des personalisierten LoRA: ~1 Stunde
Generierung von 360 Bildern: ~6 Stunden Rechenzeit
Parallele Überwachung und Feinjustierung der Parameter

Nachbearbeitung und Finalisierung
Etwa 4 Stunden pro Autor flossen in:

Sorgfältige Sichtung und Vorauswahl der Bilder
Detaillierte Retusche und Nachbearbeitung
Upscaling für Druckqualität
Abstimmungsrunden mit dem VDMB-Team

Ein besonderer Vorteil dieses Workflows: Der gesamte Prozess konnte remote durchgeführt werden. Während bei klassischen Fotoshootings die Koordination von Terminen und Locations oft eine große Herausforderung darstellt, ermöglichte die KI-gestützte Produktion eine flexible und ortsunabhängige Arbeitsweise.

Fazit: KI im hochwertigen Print – ein Blick in die Zukunft

Die Produktion der Portraits für das VDMB Jahresmagazin 2024 zeigt eindrucksvoll, wie KI-generierte Bilder heute schon professionell im Printbereich eingesetzt werden können. Der Workflow von der ersten Smartphone-Aufnahme bis zum druckfertigen Portrait ist zwar technisch anspruchsvoll, bietet aber entscheidende Vorteile gegenüber traditionellen Produktionswegen.

Effizienz neu gedacht

Der größte Gewinn liegt in der Flexibilität: Keine Terminkoordination für Fotoshootings, keine Anreisen, keine Studiomiete. Stattdessen ein durchdachter, digitaler Workflow, der hochwertige Ergebnisse liefert. Die Investition von etwa 5-6 Stunden pro Portrait mag auf den ersten Blick hoch erscheinen, relativiert sich aber im Vergleich zum Organisationsaufwand klassischer Fotoproduktionen.

Qualität und Authentizität

Die finale Qualität der Portraits zeigt, dass KI-generierte Bilder heute den hohen Ansprüchen des Printbereichs gerecht werden können. Dabei geht es nicht darum, klassische Fotografie zu ersetzen, sondern neue Möglichkeiten zu erschließen und bestehende Workflows zu ergänzen.

Das VDMB Jahresmagazin 2024 ist damit mehr als nur eine Publikation – es ist ein Beispiel dafür, wie Innovation im Printbereich praktisch umgesetzt werden kann. Es zeigt, dass die Druckbranche nicht nur über digitale Transformation spricht, sondern sie aktiv gestaltet.

Dein eigener KI-Zwilling: Der nächste Schritt

Die Erstellung der Portraits für das VDMB Jahresmagazin zeigt eindrucksvoll, welches Potenzial in der KI-gestützten Bildgenerierung steckt. Möchtest du selbst lernen, wie du solche hochwertigen KI-Portraits erstellst? In unserem Live Deep Dive „Klon dich selbst mit Flux & CustomGPTs“ zeigen wir dir, wie du deinen eigenen digitalen Zwilling erschaffst.

Du lernst nicht nur die technischen Details wie das Training von LoRAs und die Feinheiten des Promptings, sondern auch, wie du die generierten Bilder strategisch für dein Personal Branding einsetzt. In sechs intensiven Stunden bekommst du das komplette Know-how, um selbst hochwertige KI-Portraits zu erstellen – von der Aufnahme der Trainingsfotos bis zur finalen Bildgenerierung.

Profitiere von unseren Erfahrungen aus über 50 LoRA-Trainings und spare dir mühsames Trial and Error. Der nächste Deep Dive findet bereits bald statt, die Teilnehmerzahl ist auf 8 Personen begrenzt.

Vroni forscht zu Sprachmodellen, Georg trainiert seit 2022 Bild-KI Modelle

Das könnte Dich auch interessieren:

Aktuelles

KI-Schulung für Unternehmen: Was macht eine wirklich gute KI-Weiterbildung aus? Erkenntnisse aus der Praxis

KI ist zweifellos einer der prägendsten Trends unserer Zeit. Die EU-Verordnung verpflichtet seit Februar Unternehmen dazu, ihre Mitarbeitenden im Umgang mit KI zu schulen, und 65% der Unternehmen nutzen laut McKinsey bereits regelmäßig Generative AI. Diese Zahlen zeigen: Das Thema KI-Training für Mitarbeiter ist längst in der Unternehmenswelt angekommen. Doch je mehr wir uns mit professionellen KI-Schulungen beschäftigen, desto komplexer wird die Aufgabe. Wie vermittelt man ein Thema, das sich täglich weiterentwickelt? Wie schafft man

1. Juli 2025

KI im Einsatz

4 Methoden, 1 Ziel: KI Charakterkonsistenz im Praxis-Test – Midjourney v7, ChatGPT, FLUX.1 Kontext & LoRA-Training

Dein Avatar soll in jeder Szene gleich aussehen? Dann kennst du vermutlich das Problem: KI-Tools ‚vergessen‘ gerne, wie dein Charakter aussieht. Mal sind die Augen anders, mal die Frisur, mal die kompletten Gesichtszüge. Die gute Nachricht: Es gibt bewährte Methoden für echte Charakterkonsistenz. Wir haben uns vier verschiedene Ansätze genauer angeschaut, getestet und zeigen dir anhand praktischer Beispiele, welche Methode wann funktioniert – und wo die Grenzen liegen. Inhaltsverzeichnis Die vier Wege zur Charakterkonsistenz

12. Juni 2025

KI News

In-Context Editing mit FLUX.1 Kontext: Eine neue Ära für die KI-gestützte Bildbearbeitung

Es gibt eine bemerkenswerte Entwicklung im Bereich der KI-Bildgenerierung, die Aufmerksamkeit verdient: FLUX.1 Kontext, entwickelt von den Black Forest Labs. Diese Technologie hat das Potenzial, die Arbeitsweise von Marketern im Umgang mit visuellen Inhalten nachhaltig zu beeinflussen. Inhaltsverzeichnis Der Kernansatz von FLUX.1 Kontext ist die „In-Context Image Generation“. Das bedeutet, Nutzer können KI-Bilder nicht nur auf Basis von Texteingaben, sondern auch unter Verwendung bestehender Bilder als Referenz erstellen. Ein wesentliches Merkmal ist die Möglichkeit, diese

30. Mai 2025

Aktuelles

Google I/O 2025: Imagen 4, Veo 3 & Flow – Die neue Generation der KI-Bild- und Videogenerierung

Google hat auf der I/O-Konferenz 2025 sein neues KI-Bildgeneratormodell Imagen 4 vorgestellt. Die Ankündigung markiert einen bedeutenden Fortschritt im Bereich der KI-gestützten Bildgenerierung und bringt zahlreiche Verbesserungen gegenüber dem Vorgänger Imagen 3. Das Modell wurde am 20. Mai 2025 offiziell enthüllt und ist seitdem in verschiedenen Google-Produkten und -Diensten integriert Inhaltsverzeichnis Google, Google, Google… Was gibt’s Neues nach der großen Konferenz? Gerade erst hat Google wieder die Tech-Welt in Atem gehalten: Nach der I/O-Konferenz

21. Mai 2025

KI im Einsatz

Tagebuch einer Lernreise: Wie ich mit KI und n8n Prozesse automatisiere

Inhaltsverzeichnis Moin! Ich bin Kathi, Teil des KI Marketing Bootcamps, und setze mich gerade intensiv damit auseinander, wie man sich mit Automatisierungen das Leben leichter machen kann. Aktuell tauche ich tief in das Tool n8n ein – ein mächtiges No-Code-Werkzeug, mit dem sich wiederkehrende Abläufe im Marketing-Alltag automatisieren lassen. Unterstützt werde ich dabei von Marcel, der mir als Coach zeigt, wie man Prozesse strukturiert analysiert, visualisiert und schließlich so aufbaut, dass sie uns

16. Mai 2025

Aktuelles

Adobe Firefly Image 4: Qualität besser – aber viele runzeln die Stirn

„Adobe holt auf – aber reicht das?“ Georg hat’s letzte Woche auf LinkedIn treffend formuliert. Das neue Image 4 Modell liefert sichtbar bessere Ergebnisse – Gesichter, Hände, Details: alles deutlich realistischer. Aber dann kommt der Moment, in dem viele unwillkürlich die Stirn runzeln: Nur zehn Bilder pro Monat kostenlos, auch für zahlende Creative-Cloud-Nutzer:innen. Wer mehr will – oder Zugang zu den neuen externen Modellen wie Google Imagen oder OpenAI Image 1 – darf zusätzlich zahlen.

7. Mai 2025

VDMB Jahresmagazin 2024: So haben wir die Bilder generiert

Der Auftrag: Innovation im Printbereich