Georg Neumann
Oktober 7, 2023

Dall-E 3: Brillantes Textverständnis, aber die Bildqualität hinkt nach

Die Einführung von Dall-E 3 durch OpenAI hat eine Welle von Neugier und Begeisterung in der Welt der künstlichen Intelligenz und darüber hinaus ausgelöst. Mit seinem bemerkenswerten Verständnis für natürliche Sprache und seiner Fähigkeit, komplexe Prompt-Engineering-Prozesse zu überwinden, öffnet Dall-E 3 die Türen für eine intuitive Erstellung von Bildinhalten.

Textverständnis versus Bildqualität

„Wer sein gewünschtes Motiv nicht beschreiben kann, wird auch hier nicht das gewünschte Ergebnis erzielen.“

Georg Neumann, bietet uns dabei eine weise Orientierung. Während Dall-E 3 durch seine beeindruckende Interpretation von Textprompts glänzt, wirft die Inkonstanz in der Bildqualität einen Schatten auf die ansonsten beeindruckende Technologie. In anderen Tools würde so ein Satz „Generiere mir bitte eine Illustration eines süßen rothaarigen Mädchens (2 Jahre alt), das in einer Rakete zum Mond fliegt.“ nicht gut funktionieren. Erst recht nicht auf deutsch. In Dall-E 3 liefert es aber gute Ergebnisse:

Im Gegensatz dazu steht aber die Fotoqualität. Hier trifft gutes Textverständnis auf ein schlechtes Datenset (Vermutung). Die generierten Fotos sehen eher nach einem Pixar-Film aus, als nach der Realität. Aber macht euch selbst ein Bild: hier eine Testreihe:

Das ethische Dilemma der künstlichen Intelligenz

In einer Ära, in der Deepfakes und ethische Herausforderungen rund um KI-Bilder ständig präsent sind, unterstreicht OpenAI mit seinem neuen Bildgenerator sein Engagement für Transparenz und Sicherheit, um eine verantwortungsbewusste Nutzung und Erstellung von KI-Inhalten zu gewährleisten. Die Filter mögen manchmal zwar als streng wahrgenommen werden, doch sie dienen dem Schutz gegen möglichen Missbrauch – auch wenn sie noch ein wenig Feintuning benötigen könnten. Häufig läuft man noch mit vermeintlich unbedenklichen Prompts in Fehlermeldungen.

TL;DR

Trotz seiner beeindruckenden Textverständnisfähigkeiten und ethischen Sicherheitsnetze befindet sich Dall-E 3 noch in einem Stadium, in dem stetige Entwicklungen und Anpassungen erfolgen. Während es in seiner aktuellen Form vielversprechende Ansätze und beeindruckende Technik zeigt, bleibt die tatsächliche Anwendbarkeit in Bezug auf die Bildqualität hinter einigen Konkurrenten zurück.

Für wen ist Dall-E 3 geeignet?

Dall-E 3 ist perfekt für alle, die sich nicht mit Prompt Engineering auseinander setzen wollen. Selbst Tante Erna kann den Bing Chat bedienen und das Motiv für Wilfrieds Geburtstagseinladung zum 70. Geburtstag generieren. Naja, zumindest fast:

In Sachen Bildqualität punktet Dall-E 3 (wie auch schon sein Vorgänger) bei Illustrationen. Wer also nur mal schnell eine Illustration für einen Social Media Post oder einen Blogartikel braucht, kann das künftig schmerzfrei über ChatGPT oder den Bing Chat lösen. Wer weiterhin mehr Kontrolle über sein Bild haben möchte, sollte bei Midjourney, Stable Diffusion und Firefly bleiben. Vorerst.

Wie kann ich Dall-E 3 nutzen?

Du kannst es jetzt schon im Bing-Chat ausprobieren. Anforderung: Du musst mit einem Microsoft-Account eingeloggt sein.
Schau in deinem ChatGPT Account nach. Bei immer mehr Usern wird die Funktion in GPT-4 Chats ausgerollt.

Im KI Marketing Bootcamp den Umgang mit Dall-E 3 in anderen Bild-KI Tools lernen

Wir haben gerade den Termin für das nächste Bootcamp festgelegt. Am 16. November 2023 gehts los. Hier findet ihr alle Informationen und das Anmeldeformular. Wir freuen uns auf euch!

Das könnte Dich auch interessieren:

KI im Einsatz

KI Upscaler im Vergleich: Magnific AI vs. KREA vs. Topaz Labs vs. Open Source

Inhaltsverzeichnis Was ist Bild-Upscaling und wofür wird es eingesetzt? Bild-Upscaling, auch als Super-Resolution bezeichnet, ist ein Verfahren der künstlichen Intelligenz (KI), das kleine oder qualitativ

24. Juli 2024

KI im Einsatz

Sprachmodell Marketing Olympiade 2024: ChatGPT-4o vs. Claude 3.5 vs. Gemini 1.5 vs. LLama 3 vs. Deutschland GPT vs. Microsoft Copilot

Welches ist das beste Sprachmodell 2024? Wir vom KI Marketing Bootcamp laden euch herzlich zur ersten Sprachmodell Marketing Olympiade ein – einem spannenden Wettbewerb

12. Juli 2024

Aktuelles

Kreative Höhenflüge mit der Luma Dream Machine: Von Lachern zu Leistungen

Hallo zusammen! hier ist Kathi, eure Praktikantin beim KI Marketing Bootcamp! Heute stelle ich euch das spannende Tool „Luma Dream Machine“ für KI-generierte Videos

26. Juni 2024

KI News

Stable Diffusion 3 Medium: Ernüchterung statt Begeisterung

Hohe Erwartungen an Stable Diffusion 3 Die Veröffentlichung von Stable Diffusion 3 (SD3) wurde von der KI-Community sehnsüchtig erwartet. Nach den beeindruckenden Ergebnissen, die SD3

20. Juni 2024

KI im Einsatz

7 Tipps für qualitativ hochwertige Blogbeiträge mit Hilfe von KI

KI beschleunigt das Content Marketing – aber wie bekommt man auch qualitativ hochwertige Ergebnisse? Die aktuelle Statista Content Marketing Trendstudie 2024 zeigt: Hochwertiger Content

19. Juni 2024

KI im Einsatz

Digital Kompakt Podcast: Wie nutze ich Bild-KI für mein Business? 🤖

In der Folge „Wie nutze ich Bild-KI für mein Business? “ des Digital Kompakt Podcasts hat KI-Experte Georg spannende Einblicke in die Welt der generativen Bild-KI

18. Juni 2024

Dall-E 3: Brillantes Textverständnis, aber die Bildqualität hinkt nach

Textverständnis versus Bildqualität

Das ethische Dilemma der künstlichen Intelligenz

TL;DR

Für wen ist Dall-E 3 geeignet?

Wie kann ich Dall-E 3 nutzen?

Im KI Marketing Bootcamp den Umgang mit Dall-E 3 in anderen Bild-KI Tools lernen

Das könnte Dich auch interessieren:

KI Upscaler im Vergleich: Magnific AI vs. KREA vs. Topaz Labs vs. Open Source

Sprachmodell Marketing Olympiade 2024: ChatGPT-4o vs. Claude 3.5 vs. Gemini 1.5 vs. LLama 3 vs. Deutschland GPT vs. Microsoft Copilot

Kreative Höhenflüge mit der Luma Dream Machine: Von Lachern zu Leistungen

Stable Diffusion 3 Medium: Ernüchterung statt Begeisterung

7 Tipps für qualitativ hochwertige Blogbeiträge mit Hilfe von KI

Digital Kompakt Podcast: Wie nutze ich Bild-KI für mein Business? 🤖

Zum Newsletter anmelden

Sitemap

Kontakt

Rechtliches

Dall-E 3: Brillantes Textverständnis, aber die Bildqualität hinkt nach

Textverständnis versus Bildqualität

Das ethische Dilemma der künstlichen Intelligenz

TL;DR

Für wen ist Dall-E 3 geeignet?

Wie kann ich Dall-E 3 nutzen?

Im KI Marketing Bootcamp den Umgang mit Dall-E 3 in anderen Bild-KI Tools lernen

Das könnte Dich auch interessieren:

KI Upscaler im Vergleich: Magnific AI vs. KREA vs. Topaz Labs vs. Open Source

Sprachmodell Marketing Olympiade 2024: ChatGPT-4o vs. Claude 3.5 vs. Gemini 1.5 vs. LLama 3 vs. Deutschland GPT vs. Microsoft Copilot

Kreative Höhenflüge mit der Luma Dream Machine: Von Lachern zu Leistungen

Stable Diffusion 3 Medium: Ernüchterung statt Begeisterung

7 Tipps für qualitativ hochwertige Blogbeiträge mit Hilfe von KI

Digital Kompakt Podcast: Wie nutze ich Bild-KI für mein Business? 🤖

Zum Newsletter anmelden

Sitemap

Kontakt

Rechtliches

Abonniere unseren Newsletter 🥳