KI Texte erkennen: Funktionieren die Detection Tools?

Woher weiß ich, was ein Mensch geschrieben hat – und was eine KI? Menschen können dies nicht unterscheiden. Auch wenn sie es behaupten… Wie sieht es mit einer anderen KI aus? Erkennt sie, was künstlich generierter Text ist? Ein paar Tools gab’s ja schon, die das mittelgut unterscheiden konnten. Jetzt hat OpenAI einen classifier rausgebracht. Wir widmen uns also einem heißen Thema. KI Texte erkennen: Funktionieren die Detection Tools?

 

Das neueste Tools vom Platzhirsch itself: OpenAI classifier

 

Hier die Eckdaten, wie zuverlässig das neue Tool von OpenAI KI-produzierte Texte erkennt: Aus dem Test-Set an englischsprachigen Texten wurden 26% der Texte korrekt als KI-produziert erkannt, aber auch 9% der vom Menschen geschriebenen als KI-produziert gelabelt. Schon ärgerlich… oder ein Gütesiegel, wenn man so schreibt, dass die KI einen für seinesgleichen hält? 

 

Die Zuverlässigkeit der Bewertung: Tendenziell Münzwurf

 

Die Zuverlässigkeit der Ergebnisse ist bei längeren Texten besser als bei kürzeren. Insgesamt ist das Ergebnis auf gut deutsch also eher mau. Auch eine KI kann definitiv nicht zuverlässig erkennen, ob ein Text von einer KI erzeugt wurde oder nicht.  OpenAI selbst gibt folgende Hinweise: Das Tool funktioniert wirklich sehr schlecht bei Texten, die kürzer sind als 1.000 Zeichen. Und sogar noch schlechter, wenn die Texte nicht englischsprachig sind. Vom Menschen editierte Texte sind nicht identifizierbar. 

Aber: Einfach ausprobieren. Hier geht’s zum Tool.

 

Wie funktionieren KI Detection Tools überhaupt? 

 

Die Detektoren überprüfen die Wahrscheinlichkeiten innerhalb eines Texts. Kurzer Exkurs: Die Text-KI kennt ja keine Zusammenhänge. Sie arbeitet lediglich mit Wahrscheinlichkeiten. Es wird prognostiziert, welcher Buchstabe am wahrscheinlichsten auf den vorhergehenden folgt. Diese Wahrscheinlichkeit lässt sich beziffern. Wenn die Buchstaben mit einer hohen Wahrscheinlichkeit aufeinanderfolgen, dann ist der Text vermutlich KI-produziert, so die Annahme des Detektors. Ganz simpel gesagt: Steht da wirres Zeug, dann nimmt das detection tool an, dass vermutlich ein Mensch dahintersteckt. Eine KI würde so etwas nicht tun 🙂

Übrigens könnt ihr euch im OpenAI Playground die Wahrscheinlichkeiten anzeigen lassen. Einfach bevor ihr auf „Submit“ klickt unten rechts „show probabilities“ aktivieren – siehe Screenshot:

 

 

KI-Texte erkennen: Welche Tools gibt’s noch? 

 

Humans deserve the truth, sagt gptzero. Den Human Content Score berechnet Contentatscale. Und Ensur.it verspricht mehr Integrity in an AI-inhabited world. Und hier geht’s noch zu DetectGPT, das in Tests besser abschneidet, aber höhere Rechenleistung benötigt.

 

Und was ist mit Digital Watermarks? 

 

Aktuell sind watermarks derzeit noch nicht im Einsatz, so OpenAI. Aber wie würden die überhaupt funktionieren? Noch ein Exkurs in die Statistik: Menschliche und natürliche Texte folgen einem Muster. Diese Muster lassen sich statistisch darstellen. Die zugrundeliegenden Wahrscheinlichkeiten dieser Muster bedingen die Texterzeugung. Auf das erste Wort folgt ein möglichst wahrscheinliches zweites Wort – und so fort. Eine Möglichkeit, einen Text zu „watermarken“ ist, die Satzstruktur zu verändern. Zu randomisieren. Aber eigentlich nur zu pseudo-randomisieren. Denn ein trainiertes System kann diese Pseudo-Randomisierung erkennen und daraus schließen, dass der Text künstlich generiert ist. Ein Mensch hat nicht die geringste Ahnung, dass irgendwas am Text pseudo-randomisiert – oder eben faul ist. Hier gibt’s mehr Informationen für die, die es genauer wissen wollen.

 

Fazit: Ein Wett-Rüsten um das Erkennen natürlicher Sprache

 

Insgesamt betrachtet wirkt es wie ein Wettrennen. Immer bessere Sprachmodelle produzieren immer bessere Texte und die Detektoren entwickeln sich weiter. Aber immer einen Schritt hintendran. Digital watermarks sind derzeit Zukunftsmusik und können nach Aussage von OpenAI auch leicht umgangen werden: Wenn man den Text umschreibt. KI Texte erkennen: Funktionieren die Detection Tools? Nicht wirklich gut.

 

und hier noch der Prompt zum Beitragsbild: stable diffusion 2.1: detective, close up portrait photo by annie leibovitz, film, studio lighting, detailed skin

Wer hat's geschrieben?

Das könnte Dich auch interessieren:
KI im Einsatz
Aus einem Blogartikel wurde ein Spiel: Wie wir die KI-Ostersuche gebaut haben

Zwölf Nudges, zwölf Ostereier, eine Wiese. Das war die ganze Idee. Kein Konzeptpapier, kein Briefing-Marathon. Eine Frage an Claude Code: „Ostern steht vor der Tür. Was machen wir mit den 12 KI-Nudges?“ Der Blogartikel war fertig. Gut recherchiert, mit Praxisbezug, mit Substanz. Aber eben: ein Blogartikel. Scrollbar. Lesbar. Vergessbar. Die Frage war nicht „Wie kriegen wir mehr Reichweite?“, sondern: Gibt es ein Format, das die Nudges erlebbar macht, statt sie nur aufzuzählen? Von der Idee zum

Weiterlesen »
Aktuelles
Nudging und KI: Warum sanfte Stupser beim Lernen mit KI nicht reichen

Nudging ist eines dieser Konzepte, die so elegant klingen, dass man sie sofort auf alles anwenden will. Ein kleiner Stupser in die richtige Richtung, eine geschickte Voreinstellung, eine kaum merkliche Veränderung der Umgebung, und schon verhalten sich Menschen besser. Funktioniert in Kantinen, beim Organspende-Register, bei Cookie-Bannern. Warum nicht auch beim Lernen mit KI? Ich höre die Idee regelmäßig in Seminaren, besonders von Führungskräften: „Können wir nicht einfach ein paar Nudges einbauen? Ein Pop-up, das fragt:

Weiterlesen »
KI im Einsatz
12 KI-Nudges: Kleine Stupser für mehr KI-Praxis

KI-Nudges, um besser in die Praxis zu kommen! Doch was ist das überhaupt? Nudges sind kleine Schubser für dein Verhalten. Man kennt sie zum Beispiel aus der Kantine: Wenn statt dem Schnitzel der Salat vorne steht, kann das ein geplanter Schubser sein, damit du zur gesünderen Wahl greifst. Ich habe mir überlegt, mit welchen Nudges man die praktische Nutzung von KI verbessern kann. Im Nudging-Artikel habe ich beschrieben, warum klassisches Nudging beim Lernen mit KI

Weiterlesen »
KI im Einsatz
Vibecoding im Marketing: Warum Marketer jetzt programmieren lernen, ohne programmieren zu lernen

Vor drei Monaten hätte ich nicht geglaubt, dass ich das schreibe: Ich baue gerade eine Browser Extension. Sie erfasst, wie Menschen KI generierte Texte editieren. Ein Forschungstool für meine Arbeit. Ich kann nicht programmieren. Ich habe nicht programmieren gelernt. Und trotzdem funktioniert das Ding. Der Grund hat einen Namen, der gerade durch die Tech Welt geistert: Agent Coding. Oder, wie Andrej Karpathy es Anfang 2025 nannte: Vibecoding. Die Idee ist simpel und radikal zugleich. Du

Weiterlesen »
Aktuelles
„Was euch nicht gehört, könnt ihr nicht verkaufen“ – Was drei Urteile für deinen KI-Einsatz bedeuten

Drei deutsche Gerichte haben innerhalb weniger Monate die Spielregeln für generative KI neu geschrieben. Die These ist unbequem, aber belastbar: Wer KI-Output als eigene kreative Leistung verkauft, ohne den menschlichen Gestaltungsbeitrag nachweisen zu können, steht rechtlich mit leeren Händen da. Und haftet trotzdem für alles, was rauskommt. Das betrifft nicht irgendwelche Tech-Konzerne in Kalifornien. Das betrifft jede Agentur, die nächste Woche ein KI-generiertes Logo an einen Kunden liefert. INPUT: Was die KI frisst – und

Weiterlesen »
ixel-Art-Illustration eines Detektivs im Trenchcoat und mit Sonnenbrille. Er hält ein leuchtend grünes Dokument mit der Aufschrift 'skills.md' in der Hand. Rechts daneben ist ein aufsteigender Aktienchart mit der Überschrift 'STONKS' zu sehen, sowie kleine Symbole für ein Gehirn, ein Zahnrad und eine Tastatur. Der Detektiv hat eine Sprechblase: 'SKILLS.MD: MUCH WOW, VERY AGENT.'
KI im Einsatz
Agent Skills schreiben: Anleitung mit Marketing-Beispielen

Im Analyse-Artikel über Skills Engineering habe ich beschrieben, warum strukturiertes Prozesswissen die nächste Stufe der KI-Nutzung ist. Dieser Beitrag ist die praktische Seite: Wie schreibt man einen Agent Skill? Was gehört rein, was nicht? Und wie sieht das für typische Marketing-Aufgaben aus? Was ein Agent Skill technisch ist Ein Agent Skill ist auf seine allereinfachste Weise einfach eine Textdatei namens SKILL.md. Nicht mehr, also nicht verrückt machen lassen, nur weil das fancy klingt. Absolut machbar

Weiterlesen »

Hey Du. Willst du AI Content Manager werden?

Dann ab ins kostenfreie Info-Webinar am 25.03. um 12:00 Uhr. 

🚀 Exklusive Back-to-School-Aktion 🚀

Spare 880 € beim KI-Marketing-Bootcamp!

Bring eine Kolleg*in mit und erhalte 50% Rabatt für deine Begleitung.

Nur für kurze Zeit und solange Kontingent reicht! Aktion endet am 16. September 2024.

Abonniere unseren Newsletter 🥳