Dall-E 3: Brillantes Textverständnis, aber die Bildqualität hinkt nach

Die Einführung von Dall-E 3 durch OpenAI hat eine Welle von Neugier und Begeisterung in der Welt der künstlichen Intelligenz und darüber hinaus ausgelöst. Mit seinem bemerkenswerten Verständnis für natürliche Sprache und seiner Fähigkeit, komplexe Prompt-Engineering-Prozesse zu überwinden, öffnet Dall-E 3 die Türen für eine intuitive Erstellung von Bildinhalten.

 

Textverständnis versus Bildqualität

„Wer sein gewünschtes Motiv nicht beschreiben kann, wird auch hier nicht das gewünschte Ergebnis erzielen.“ 

Georg Neumann, bietet uns dabei eine weise Orientierung. Während Dall-E 3 durch seine beeindruckende Interpretation von Textprompts glänzt, wirft die Inkonstanz in der Bildqualität einen Schatten auf die ansonsten beeindruckende Technologie. In anderen Tools würde so ein Satz „Generiere mir bitte eine Illustration eines süßen rothaarigen Mädchens (2 Jahre alt), das in einer Rakete zum Mond fliegt.“ nicht gut funktionieren. Erst recht nicht auf deutsch. In Dall-E 3 liefert es aber gute Ergebnisse:

 

Im Gegensatz dazu steht aber die Fotoqualität. Hier trifft gutes Textverständnis auf ein schlechtes Datenset (Vermutung). Die generierten Fotos sehen eher nach einem Pixar-Film aus, als nach der Realität. Aber macht euch selbst ein Bild: hier eine Testreihe:

 

 

Das ethische Dilemma der künstlichen Intelligenz

 

In einer Ära, in der Deepfakes und ethische Herausforderungen rund um KI-Bilder ständig präsent sind, unterstreicht OpenAI mit seinem neuen Bildgenerator sein Engagement für Transparenz und Sicherheit, um eine verantwortungsbewusste Nutzung und Erstellung von KI-Inhalten zu gewährleisten. Die Filter mögen manchmal zwar als streng wahrgenommen werden, doch sie dienen dem Schutz gegen möglichen Missbrauch – auch wenn sie noch ein wenig Feintuning benötigen könnten. Häufig läuft man noch mit vermeintlich unbedenklichen Prompts in Fehlermeldungen. 

 

TL;DR

 

Trotz seiner beeindruckenden Textverständnisfähigkeiten und ethischen Sicherheitsnetze befindet sich Dall-E 3 noch in einem Stadium, in dem stetige Entwicklungen und Anpassungen erfolgen. Während es in seiner aktuellen Form vielversprechende Ansätze und beeindruckende Technik zeigt, bleibt die tatsächliche Anwendbarkeit in Bezug auf die Bildqualität hinter einigen Konkurrenten zurück. 

 

Für wen ist Dall-E 3 geeignet?

 

Dall-E 3 ist perfekt für alle, die sich nicht mit Prompt Engineering auseinander setzen wollen. Selbst Tante Erna kann den Bing Chat bedienen und das Motiv für Wilfrieds Geburtstagseinladung zum 70. Geburtstag generieren. Naja, zumindest fast:

 

In Sachen Bildqualität punktet Dall-E 3 (wie auch schon sein Vorgänger) bei Illustrationen. Wer also nur mal schnell eine Illustration für einen Social Media Post oder einen Blogartikel braucht, kann das künftig schmerzfrei über ChatGPT oder den Bing Chat lösen. Wer weiterhin mehr Kontrolle über sein Bild haben möchte, sollte bei Midjourney, Stable Diffusion und Firefly bleiben. Vorerst. 

 

Wie kann ich Dall-E 3 nutzen?

  1. Du kannst es jetzt schon im Bing-Chat ausprobieren. Anforderung: Du musst mit einem Microsoft-Account eingeloggt sein.
  2. Schau in deinem ChatGPT Account nach. Bei immer mehr Usern wird die Funktion in GPT-4 Chats ausgerollt. 

 

Im KI Marketing Bootcamp den Umgang mit Dall-E 3 in anderen Bild-KI Tools lernen

 

Wir haben gerade den Termin für das nächste Bootcamp festgelegt. Am 16. November 2023 gehts los. Hier findet ihr alle Informationen und das Anmeldeformular. Wir freuen uns auf euch!

 

Das könnte Dich auch interessieren:
Aktuelles
Mehr als nur Text: So nutzt du den ChatGPT 4o Image Generator fürs Marketing

Wir kennen ChatGPT längst als zuverlässigen Texter, der uns bei allem von Headlines bis Blogartikeln unterstützt. Doch mittlerweile kann er noch mehr – und zwar Bilder erstellen. Nicht wirklich neu für alle, die sich mit KI beschäftigen, aber spannend bleibt’s trotzdem: Aus dem reinen Schreibassistenten wird ein visueller Kreativpartner. Und das Beste? Alles läuft direkt im gewohnten Chatfenster ab – ganz ohne Toolswitch. Für uns im Marketing eröffnet das neue Möglichkeiten: Content-Ideen lassen sich schneller

Weiterlesen »
Aktuelles
OpenAI-Modelle im Vergleich: GPT-4o, GPT-4.5, o3 & Co für Marketing-Teams

Gefühlt gibt es plötzlich ein halbes Dutzend verschiedene ChatGPT-Modelle – und ständig kommt ein neues dazu. GPT-4, GPT-4o, GPT-4.5, o1, o3 Mini, Mini High, Turbo… Moment mal – was soll das alles eigentlich heißen?   Für viele fühlt sich das ein bisschen an wie ein Upgrade-Dschungel: Man will einfach nur wissen, was das richtige Modell für den eigenen Use Case ist – und wird stattdessen mit Abkürzungen, Preisen und Features bombardiert. Aber keine Sorge: Genau

Weiterlesen »
Aktuelles
Midjourney V7 ist da – Was das neue Modell fürs Marketing bedeutet

Mit Midjourney V7 ist das neue Bildgenerierungsmodell offiziell da – und bringt einige spannende Veränderungen mit. Die Bildqualität hat sich deutlich weiterentwickelt, neue Modi wie der Draft Mode versprechen schnellere Ergebnisse, und auch die Detailtiefe bei Gesichtern, Lichtstimmungen und Texturen wurde spürbar verbessert.   Doch was bedeutet das konkret für den Einsatz im Marketing?Welche neuen Möglichkeiten ergeben sich für Kreative, Marken und Kampagnen – und wo stößt V7 (noch) an seine Grenzen?   In diesem

Weiterlesen »
Aktuelles
KI & HR: Was der EU AI Act für Personalabteilungen bedeutet – Ein Interview mit Kirstin Elisabeth Koubé 2.0

Die Verabschiedung des EU AI Acts markiert einen Meilenstein in der Regulierung künstlicher Intelligenz (KI) innerhalb der Europäischen Union. Diese neue Verordnung legt nicht nur technische Standards für KI-Systeme fest, sondern hebt auch die Bedeutung der Weiterentwicklung von KI-Kompetenzen in Unternehmen hervor. Insbesondere Artikel 4 betont, dass Unternehmen geeignete Schulungs- und Weiterbildungsmaßnahmen fördern sollten, um den verantwortungsvollen Umgang mit KI zu gewährleisten.   In einem früheren Blogbeitrag: „EU AI Act: werden KI-Schulungen zur Pflicht?“ haben wir

Weiterlesen »
Aktuelles
Vibe Marketing mit KI: Effizienz-Booster oder Einheitsbrei in Hochgeschwindigkeit?

„Vibe Marketing“ – das klingt erstmal nach TikTok, After-Work-Gin und einem schicken Buzzword für Agenturpräsentationen. Tatsächlich beschreibt der Begriff aber eine Entwicklung, die gerade viele Marketingteams (und Solo-Marketer) massiv beeinflusst – und zwar nicht nur im positiven Sinne. Denn im Kern geht es bei Vibe Marketing um eines: Möglichst schnell und flexibel auf Stimmungen, Trends und Zielgruppenbedürfnisse zu reagieren. Möglich wird das durch KI-gestützte Tools, die Texte, Bilder, Videos und Ideen in Rekordzeit produzieren –

Weiterlesen »
Aktuelles
Ist Freepik die eierlegende Wollmilchsau unter den Bildgeneratoren?

KI Tools im Marketing gibt es viele – aber welche bringen wirklich Ergebnisse? Und vor allem: Wie kannst du sie praxisnah anwenden?   Genau diese Frage stellen wir uns regelmäßig im KI Marketing Bootcamp. Denn Theorie ist gut, Praxis ist besser. Deshalb setzen wir auf Hands-on-Training mit den besten KI Tools. Eines davon – oder besser gesagt, unser neuer Favorit: Freepik. Warum? Weil es die perfekte Brücke zwischen Idee und Umsetzung ist – und zeigt,

Weiterlesen »

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳