Mathilda auf dem Mond – ein Kinderbuch von ChatGPT und Stable Diffusion

Kreative Grenzen zu sprengen, ist das A und O in der Welt der KI. Mein jüngstes Projekt? Ein Kinderbuch mit dem Titel „Mathilda auf dem Mond“, inspiriert und illustriert durch die Magie der Künstlichen Intelligenz – und das, obwohl meine Zeichenkünste zu wünschen übrig lassen und Reimen nicht gerade meine Stärke ist.

Jede Geschichte beginnt mit einer Idee. „Mathilda auf dem Mond“ erzählt von einem kleinen Mädchen, meiner Tochter Mathilda, die den Traum hat, den Mond zu bereisen. Eine Geschichte voller Fantasie, Abenteuer und der unbändigen Neugier eines Kindes.

KI als kreatives Werkzeug


Um dieses Traumprojekt zu verwirklichen, wandte ich mich der KI zu. Ein maßgeschneidertes Stable Diffusion Modell, trainiert mit Bildern meiner Tochter, ermöglichte es mir, wunderschöne und konsistente Illustrationen zu generieren. ChatGPT half mir dabei, die Geschichte zu entwickeln und in Worte zu fassen, ohne dass ich mich mit Reimen herumschlagen musste.

 

Das Ergebnis ist ein Buch, das nicht nur die Fantasie von Kindern anregt, sondern auch Erwachsene in Staunen versetzt. „Mathilda auf dem Mond“ ist nicht nur ein Kinderbuch, sondern auch ein Beweis dafür, was KI in kreativen Händen zu leisten vermag.

Promptengineering für konstanten Illustrationsstil


Um einen kohärenten Stil für alle Bilder zu entwickeln, habe ich einen Stilmix aus bekannten IllustratorInnen geschaffen. Durch diese Neuschöpfung aus den Stilen von Goro Fujita und Iwona Lifsches schaffe ich etwas gänzlich neues. 

 

Um z. B. immer die gleiche Kleidung in den Bildern zu erhalten, kann man noch Tricks anwenden und die Kleidung konkreter beschreiben. z. B. „in a blue dress and a red jacket“ – dies hat zumindest zu annähernd ähnlicher Kleidung geführt. Close enough!

a storybook illustration of 3 year old redhaired ms little girl as a astronaut on the moon, in the style of goro fujita and Iwona Lifsches

ControlNet für komplexe Motive


Beim Generieren von komplexeren Motiven stößt man mit Prompt Engineering oft an Grenzen, bei denen es sich lohnt über alternative Techniken und Workflows nachzudenken. Beim Motiv mit der Mondlandung habe ich mich daher entschieden, mittels Photoshop eine grobe Vorlage zu bauen, die ich dann per ControlNet in Stable Diffusion als Vorlage für die Generierung nutzen konnte. 

 

Eigens trainierte Stable Diffusion Modelle als Chance

Diese persönliche Erfahrung spiegelt das Potenzial wider, das KI im geschäftlichen Bereich bietet. Ähnliche Technologien, angewendet in Marketing und Design, können Unternehmen dabei helfen, ihre eigenen kreativen Grenzen zu erweitern. Mehr dazu erfährst Du hier: Wir trainieren Stable Diffusion Modelle für dein Unternehmen

 

 

Datensicherheit

Puh, ein Checkpoint feingetunt auf eine Person bietet unendliches Potenzial in der Bildgenerierung; von lustigen Szenen über wirklich schadhaftes Material – je nach krimineller Energie. Daher war es mir wichtig, dass ich das Bildmodell nur lokal auf meinem eigenen Computer trainiere, um die vollständige Datenhoheit zu wahren. Wer das Thema nicht wirklich ernst nimmt, sollte sich diesen Werbespot der Telekom ansehen.

 

 

Vom Entwurf zur Produktion

Für die Produktion eines Einzelstücks habe ich mich nach kurzer Recherche für fotofabrik.de entschieden. Das Pappbuch Deluxe hat wirklich eine sehr hochwertige Verarbeitung, sehr dicke Seiten, die auch für ein Kleinkind gut geeignet sind und eine sehr gute Druckqualität. 

 

Fazit

„Mathilda auf dem Mond“ ist mehr als nur ein Kinderbuch – es ist ein Beispiel dafür, wie KI unsere Vorstellungskraft beflügeln kann. Egal ob im privaten Bereich oder im Business – KI öffnet Türen zu neuen kreativen Welten. Bist Du bereit, Deine zu öffnen? Dann komm in unser KI Marketing Bootcamp oder schreib uns für individuelle Beratung: info@marketing-ki.de

 

Und das Beste: Das Buch war als Weihnachtsgeschenk gedacht, ich war aber zu ungeduldig. Aber das ist auch völlig egal – sie liebt ihr Buch und ein neues zu generieren ist mit einem etablierten Modell und Prompt überhaupt kein Akt. Was darf es als Nächstes sein? Mathilda auf dem Bauernhof? Mathilda allein im Zoo? Mathilda und die Dinos?

"Mathilda auf dem Mond" zum Durchblättern

Wer hat's geschrieben?

Das könnte Dich auch interessieren:
Minimalistische, quadratische Infografik mit dem Haupttitel "EVOLUTION: PROMPT -> CONTEXT -> SKILLS ENGINEERING". Darunter befinden sich drei farblich kodierte, rechteckige Felder, die durch Pfeile von links nach rechts verbunden sind und einen Entwicklungsprozess darstellen. Das linke, hellblaue Feld ist betitelt mit "PROMPT ENGINEERING". Es enthält eine Ikone einer Gedankenblase mit einem Fragezeichen und einer Lupe über Text. Text darunter: "FOCUS: Single Input", "QUESTION: 'How do I formulate my instruction?'", "GOAL: Perfect the prompt". Ein Pfeil zeigt auf das mittlere, hellorange Feld mit dem Titel "CONTEXT ENGINEERING". Die Ikone zeigt Dokumente, eine Cloud-Datenbank und Zahnräder. Text darunter: "FOCUS: Information", "QUESTION: 'What information does the AI need?'", "GOAL: Provide background data". Ein weiterer Pfeil zeigt auf das rechte, hellgrüne Feld mit dem Titel "SKILLS ENGINEERING". Die Ikone zeigt ein Flussdiagramm mit Entscheidungsknoten und einem abgehakten Kontrollkästchen. Text darunter: "FOCUS: Process Knowledge", "QUESTION: 'What process knowledge does the AI need?'", "GOAL: Optimize action competence". Am unteren Rand der Grafik fasst eine Zeile das Ergebnis der Evolution zusammen: "OPTIMIZES: Single Interactions -> Knowledge State -> Action Competence".
KI im Einsatz
Skills Engineering: Ist das was Neues oder die Weiterentwicklung von Prompt- und Context Engineering?

Nach Prompt Engineering kam Context Engineering. Jetzt zeichnet sich ab, was als Nächstes kommt: Skills Engineering. Ich rechne damit, dass der Begriff in den kommenden Monaten zunehmend auftaucht. Denn die Entwicklung dahin, was damit gemeint ist, ist sinnvoll und konsequent, wenn man bessere Ergebnisse mit KI erzielen will. Was ist Skills Engineering? „Skills Engineering beschreibt die Kompetenz, menschliches Prozesswissen so aufzubereiten, dass KI-Agenten es nutzen können.“ (Vroni) Das klingt abstrakt, meint aber etwas sehr Konkretes.

Weiterlesen »
Aktuelles
Nano Banana 2: Pro-Qualität zum Flash-Preis?

Google hat letzte Woche Nano Banana 2 veröffentlicht, technisch das Modell Gemini 3.1 Flash Image. Es ersetzt Nano Banana Pro als Standard in der Gemini-App und soll Pro-Level-Qualität bei deutlich höherer Geschwindigkeit und rund halbem Preis liefern. Ich hab’s direkt gegen Pro antreten lassen. Mein erster Eindruck: Nano Banana 2 ist verdammt nah dran. Aber vor allem ist es schnell. Geschwindigkeit als echter Hebel Während man bei Pro teilweise Minuten auf ein einzelnes Bild warten

Weiterlesen »
Aktuelles
Die neue Knappheit: Warum mehr Content weniger wert ist

Content kostet fast nichts mehr. Ein Blogpost? Fünf Minuten mit Claude. Zehn Social-Media-Varianten? Noch mal drei Minuten. Ein kompletter Redaktionsplan für sechs Monate? Eine Stunde, wenn man gründlich ist. Die Produktionskosten sind auf nahezu Null gefallen. Und genau deshalb ist die meiste Content-Strategie, die ich sehe, gerade dabei, wertlos zu werden. Das klingt paradox. Aber die Ökonomie ist eindeutig: Wenn etwas im Überfluss existiert, verliert es seinen Wert. Was knapp bleibt, wird kostbar. Content ist

Weiterlesen »
KI News
Dein KI-Anbieter wurde gerade zum Sicherheitsrisiko erklärt. Was jetzt?

Am Freitag hat die US-Regierung Anthropic auf eine Stufe mit Huawei gestellt. Nicht wegen Spionage, nicht wegen Verbindungen zu feindlichen Staaten, sondern weil das Unternehmen sich weigerte, zwei Sicherheitsleitplanken aus einem Pentagon-Vertrag zu entfernen: keine Massenüberwachung von US-Bürgern, keine vollständig autonomen Waffensysteme. Wenige Stunden später verkündete OpenAI, den frei gewordenen Platz übernommen zu haben. CEO Sam Altman behauptete, sein Deal enthalte dieselben Sicherheitsprinzipien. Aber wer genau hinschaut, sieht: OpenAI hat den entscheidenden Kompromiss gemacht, den

Weiterlesen »
Ein Detailfoto, das eine Hand eines Geschäftsmannes im Anzug zeigt, die aus einer Spraydose mit dem Etikett „AI WASHING“ einen cyanfarbenen Dunst auf eine rissige Betonwand sprüht. Die Spraydose ist eine silberne Metalldose mit einem goldfarbenen Etikett und einem schwarzen Sprühkopf, die er mit Daumen und Zeigefinger hält. An seiner Hand trägt er einen goldenen Ehering und eine goldene Armbanduhr mit einem hellen Zifferblatt, die am Handgelenk sichtbar ist. Auf der rissigen Betonwand sind links einige Wörter eingeritzt, darunter „DOWNSIZING“, „LAYOFFS“, „DOWNSIZING“, „BUDGET“ und „AUSTERITY“, die alle grau und schwer lesbar sind. Der cyanfarbene Dunst, der aus der Spraydose sprüht, bildet auf der Wand eine leuchtend cyanfarbene, digitale Oberfläche mit Schaltkreisen, Icons und leuchtenden Wörtern. Oben links auf dieser Oberfläche steht „AI INNOVATION“, darunter „FUTURE EFFICIENCY“ und ganz unten „AUTOMATION“. Der Geschäftsmann steht rechts und sprüht den Dunst auf die linke Seite der Wand, wodurch die graue Wand mit den negativen Wörtern übermalt wird. Der Hintergrund ist ein unscharfer, dunkler Büroraum mit einigen Schreibtischen und Lampen. Die Betonwand ist links rissig und uneben, rechts wird sie durch die digitale, leuchtende Oberfläche glatt und modern.
Aktuelles
AI-Washing: Wenn „KI-Transformation“ Entlassungen bedeutet

Block, das Unternehmen hinter Square und Cash App, hat gestern 4.000 Menschen entlassen, das entspricht 40 Prozent der Belegschaft. CEO Jack Dorsey nennt es eine strategische Entscheidung für die KI-Zukunft. Für die Betroffenen klingt „intelligence-native company“ vermutlich anders als für die Investoren, die den Kurs nach oben trieben. Und für alle, die sich fragen, was KI tatsächlich mit Arbeitsplätzen macht, lohnt sich ein genauerer Blick – auf die Zahlen, die Narrative und die Forschung dahinter.

Weiterlesen »
KI im Einsatz
Der Bullshit Benchmark: Was passiert, wenn KI-Modelle auf Unsinn hereinfallen

55 Fragen, jede einzelne davon Unsinn. Und die meisten Sprachmodelle haben brav geantwortet, als wäre alles völlig plausibel. Peter Gostev, AI Capability Lead bei Arena, hat mit seinem „Bullshit Benchmark“ etwas sichtbar gemacht, das ich seit 2022 in jeder Schulung predige: Die gefährlichste Eigenschaft von Sprachmodellen ist nicht, dass sie Fehler machen. Es ist, dass sie Fehler machen, die sich richtig anfühlen. Was der Bullshit Benchmark testet Die Idee ist so simpel wie entlarvend: Gostev

Weiterlesen »

Hey Kreativer. Willst du AI Art Director werden? 🎨

Dann ab ins kostenfreie Info-Webinar am 19.03. um 12:00 Uhr. 

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳