Dall-E 3: Brillantes Textverständnis, aber die Bildqualität hinkt nach

Die Einführung von Dall-E 3 durch OpenAI hat eine Welle von Neugier und Begeisterung in der Welt der künstlichen Intelligenz und darüber hinaus ausgelöst. Mit seinem bemerkenswerten Verständnis für natürliche Sprache und seiner Fähigkeit, komplexe Prompt-Engineering-Prozesse zu überwinden, öffnet Dall-E 3 die Türen für eine intuitive Erstellung von Bildinhalten.

 

Textverständnis versus Bildqualität

„Wer sein gewünschtes Motiv nicht beschreiben kann, wird auch hier nicht das gewünschte Ergebnis erzielen.“ 

Georg Neumann, bietet uns dabei eine weise Orientierung. Während Dall-E 3 durch seine beeindruckende Interpretation von Textprompts glänzt, wirft die Inkonstanz in der Bildqualität einen Schatten auf die ansonsten beeindruckende Technologie. In anderen Tools würde so ein Satz „Generiere mir bitte eine Illustration eines süßen rothaarigen Mädchens (2 Jahre alt), das in einer Rakete zum Mond fliegt.“ nicht gut funktionieren. Erst recht nicht auf deutsch. In Dall-E 3 liefert es aber gute Ergebnisse:

 

Im Gegensatz dazu steht aber die Fotoqualität. Hier trifft gutes Textverständnis auf ein schlechtes Datenset (Vermutung). Die generierten Fotos sehen eher nach einem Pixar-Film aus, als nach der Realität. Aber macht euch selbst ein Bild: hier eine Testreihe:

 

 

Das ethische Dilemma der künstlichen Intelligenz

 

In einer Ära, in der Deepfakes und ethische Herausforderungen rund um KI-Bilder ständig präsent sind, unterstreicht OpenAI mit seinem neuen Bildgenerator sein Engagement für Transparenz und Sicherheit, um eine verantwortungsbewusste Nutzung und Erstellung von KI-Inhalten zu gewährleisten. Die Filter mögen manchmal zwar als streng wahrgenommen werden, doch sie dienen dem Schutz gegen möglichen Missbrauch – auch wenn sie noch ein wenig Feintuning benötigen könnten. Häufig läuft man noch mit vermeintlich unbedenklichen Prompts in Fehlermeldungen. 

 

TL;DR

 

Trotz seiner beeindruckenden Textverständnisfähigkeiten und ethischen Sicherheitsnetze befindet sich Dall-E 3 noch in einem Stadium, in dem stetige Entwicklungen und Anpassungen erfolgen. Während es in seiner aktuellen Form vielversprechende Ansätze und beeindruckende Technik zeigt, bleibt die tatsächliche Anwendbarkeit in Bezug auf die Bildqualität hinter einigen Konkurrenten zurück. 

 

Für wen ist Dall-E 3 geeignet?

 

Dall-E 3 ist perfekt für alle, die sich nicht mit Prompt Engineering auseinander setzen wollen. Selbst Tante Erna kann den Bing Chat bedienen und das Motiv für Wilfrieds Geburtstagseinladung zum 70. Geburtstag generieren. Naja, zumindest fast:

 

In Sachen Bildqualität punktet Dall-E 3 (wie auch schon sein Vorgänger) bei Illustrationen. Wer also nur mal schnell eine Illustration für einen Social Media Post oder einen Blogartikel braucht, kann das künftig schmerzfrei über ChatGPT oder den Bing Chat lösen. Wer weiterhin mehr Kontrolle über sein Bild haben möchte, sollte bei Midjourney, Stable Diffusion und Firefly bleiben. Vorerst. 

 

Wie kann ich Dall-E 3 nutzen?

  1. Du kannst es jetzt schon im Bing-Chat ausprobieren. Anforderung: Du musst mit einem Microsoft-Account eingeloggt sein.
  2. Schau in deinem ChatGPT Account nach. Bei immer mehr Usern wird die Funktion in GPT-4 Chats ausgerollt. 

 

Im KI Marketing Bootcamp den Umgang mit Dall-E 3 in anderen Bild-KI Tools lernen

 

Wir haben gerade den Termin für das nächste Bootcamp festgelegt. Am 16. November 2023 gehts los. Hier findet ihr alle Informationen und das Anmeldeformular. Wir freuen uns auf euch!

 

Das könnte Dich auch interessieren:
Aktuelles
KI-Schulung für Unternehmen: Was macht eine wirklich gute KI-Weiterbildung aus? Erkenntnisse aus der Praxis

KI ist zweifellos einer der prägendsten Trends unserer Zeit. Die EU-Verordnung verpflichtet seit Februar Unternehmen dazu, ihre Mitarbeitenden im Umgang mit KI zu schulen, und 65% der Unternehmen nutzen laut McKinsey bereits regelmäßig Generative AI. Diese Zahlen zeigen: Das Thema KI-Training für Mitarbeiter ist längst in der Unternehmenswelt angekommen.   Doch je mehr wir uns mit professionellen KI-Schulungen beschäftigen, desto komplexer wird die Aufgabe. Wie vermittelt man ein Thema, das sich täglich weiterentwickelt? Wie schafft man

Weiterlesen »
KI im Einsatz
4 Methoden, 1 Ziel: KI Charakterkonsistenz im Praxis-Test – Midjourney v7, ChatGPT, FLUX.1 Kontext & LoRA-Training

Dein Avatar soll in jeder Szene gleich aussehen? Dann kennst du vermutlich das Problem: KI-Tools ‚vergessen‘ gerne, wie dein Charakter aussieht. Mal sind die Augen anders, mal die Frisur, mal die kompletten Gesichtszüge.   Die gute Nachricht: Es gibt bewährte Methoden für echte Charakterkonsistenz. Wir haben uns vier verschiedene Ansätze genauer angeschaut, getestet und zeigen dir anhand praktischer Beispiele, welche Methode wann funktioniert – und wo die Grenzen liegen. Inhaltsverzeichnis Die vier Wege zur Charakterkonsistenz

Weiterlesen »
KI News
In-Context Editing mit FLUX.1 Kontext: Eine neue Ära für die KI-gestützte Bildbearbeitung

Es gibt eine bemerkenswerte Entwicklung im Bereich der KI-Bildgenerierung, die Aufmerksamkeit verdient: FLUX.1 Kontext, entwickelt von den Black Forest Labs. Diese Technologie hat das Potenzial, die Arbeitsweise von Marketern im Umgang mit visuellen Inhalten nachhaltig zu beeinflussen. Inhaltsverzeichnis Der Kernansatz von FLUX.1 Kontext ist die „In-Context Image Generation“. Das bedeutet, Nutzer können KI-Bilder nicht nur auf Basis von Texteingaben, sondern auch unter Verwendung bestehender Bilder als Referenz erstellen. Ein wesentliches Merkmal ist die Möglichkeit, diese

Weiterlesen »
Aktuelles
Google I/O 2025: Imagen 4, Veo 3 & Flow – Die neue Generation der KI-Bild- und Videogenerierung

Google hat auf der I/O-Konferenz 2025 sein neues KI-Bildgeneratormodell Imagen 4 vorgestellt. Die Ankündigung markiert einen bedeutenden Fortschritt im Bereich der KI-gestützten Bildgenerierung und bringt zahlreiche Verbesserungen gegenüber dem Vorgänger Imagen 3. Das Modell wurde am 20. Mai 2025 offiziell enthüllt und ist seitdem in verschiedenen Google-Produkten und -Diensten integriert Inhaltsverzeichnis Google, Google, Google… Was gibt’s Neues nach der großen Konferenz?   Gerade erst hat Google wieder die Tech-Welt in Atem gehalten: Nach der I/O-Konferenz

Weiterlesen »
KI im Einsatz
Tagebuch einer Lernreise: Wie ich mit KI und n8n Prozesse automatisiere

Inhaltsverzeichnis Moin!   Ich bin Kathi, Teil des KI Marketing Bootcamps, und setze mich gerade intensiv damit auseinander, wie man sich mit Automatisierungen das Leben leichter machen kann.   Aktuell tauche ich tief in das Tool n8n ein – ein mächtiges No-Code-Werkzeug, mit dem sich wiederkehrende Abläufe im Marketing-Alltag automatisieren lassen. Unterstützt werde ich dabei von Marcel, der mir als Coach zeigt, wie man Prozesse strukturiert analysiert, visualisiert und schließlich so aufbaut, dass sie uns

Weiterlesen »
Aktuelles
Adobe Firefly Image 4: Qualität besser – aber viele runzeln die Stirn

„Adobe holt auf – aber reicht das?“ Georg hat’s letzte Woche auf LinkedIn treffend formuliert. Das neue Image 4 Modell liefert sichtbar bessere Ergebnisse – Gesichter, Hände, Details: alles deutlich realistischer. Aber dann kommt der Moment, in dem viele unwillkürlich die Stirn runzeln: Nur zehn Bilder pro Monat kostenlos, auch für zahlende Creative-Cloud-Nutzer:innen. Wer mehr will – oder Zugang zu den neuen externen Modellen wie Google Imagen oder OpenAI Image 1 – darf zusätzlich zahlen.

Weiterlesen »

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳