Studie Warum KI-Lyrik als besser empfunden wird
Ein weiterer Fortschritt der Künstlichen Intelligenz: Wie eine Studie zeigt, kann sie nicht nur täuschend echte Gedichte generieren. Ihre Lyrik wird sogar als besser empfunden als von Shakespeare und Co.
Podcast-Gespräche, Musik oder Witze - Künstliche Intelligenz ist offenbar in der Lage, täuschend echte Kunst zu generieren. Künstlich erzeugte Gemälde oder Gesichter werden sogar eher als echt anerkannt als das menschliche Pendant. Eine neue Studie hat nun gezeigt: Auch Lyrik beherrscht die KI mittlerweile besser als wir Menschen.
In der Studie, die jetzt in Scientific Reports veröffentlicht wurde, wollte Studienleiter Brian Porter testen, ob Menschen zwischen KI-generierter Poesie und der eines menschlichen Dichters unterscheiden können. Messen musste sich die KI mit namhaften Künstlern wie Shakespeare, Lord Byron, T.S. Eliot und Sylvia Plath.
Probanden empfanden Gedichte der KI als menschlicher
Jedem der 1.634 Teilnehmenden wurden zehn Gedichte präsentiert. Aus einer Auswahl an bekannten Dichtern wurden für jeden Probanden fünf Gedichte nach dem Zufallsprinzip ausgewählt. Die anderen fünf Gedichte wurden von der KI ChatGPT 3.5 verfasst und sollten dem Stil der Dichterin oder des Dichters entsprechen. Wichtig war den Forschenden, dass keiner der Teilnehmenden eine tiefere Expertise auf dem Gebiet der Lyrik hatte.
Zu jedem der zehn Gedichte wurden die Probanden befragt, ob sie glaubten, das Werk sei KI-generiert oder menschengemacht. Es kam heraus, dass vier der fünf Gedichte, die am häufigsten als menschlich bewertet wurden, künstlicher Natur waren. Die fünf Gedichte die in diesem Ranking am seltensten als menschlich eingestuft wurden, waren dagegen alle von echten Dichterinnen und Dichtern.
KI-Gedichte als einfacher und zugänglicher bewertet
In einem zweiten Experiment bewertete eine andere Gruppe von 696 Teilnehmenden die Gedichte auf Merkmale wie Qualität, Schönheit, Emotion, Rhythmus und Originalität. Dabei beurteilten die Teilnehmenden KI-generierte Gedichte durchweg positiver als die von Menschen geschriebenen.
Die Studienautoren vermuten, dass die Teilnehmenden KI-Gedichte auch deshalb bevorzugten, weil sie einfacher und zugänglicher waren als die Werke der prominenten Dichterinnen und Dichter. So bewerteten die Teilnehmenden echte von Menschen verfasste Gedichte weit häufiger mit der Aussage "ergibt keinen Sinn" als KI-Gedichte.
Wenige Menschen trauen einer KI gute Gedichte zu
Auch die Erwartungshaltung spielte eine Rolle. So gingen die Teilnehmenden davon aus, dass ihnen von Menschen geschriebene Gedichte sicher besser gefallen würden. Aber sie bevorzugten die leichter verständlichen KI-generierten Gedichte. Ihre eigene Vorliebe dafür interpretierten sie dann fälschlicherweise als Beweis für menschliche Autorenschaft.
Dabei gingen die Teilnehmenden davon aus, dass eine KI gar nicht in der Lage sein kann, Gedichte zu produzieren, die ihnen mindestens so gut gefallen wie von Menschen geschriebene Gedichte. Doch die Ergebnisse zeigen, dass diese Erwartung falsch ist.
Bisher überzeugte KI-Poesie nicht
Nach Ansicht der Forschenden zeigt das einen großen Fortschritt in der Leistungsfähigkeit der generativen KI - also KI, die Texte, Bilder oder Videos erstellen kann. Poesie war bisher einer der wenigen Bereiche, in denen KI-Modelle noch nicht das Niveau erreicht hatten, ab dem man die Ergebnisse auch für menschlich erzeugt halten konnte.
So konnten Menschen die Poesie des KI Vorgängermodells GPT 2 noch ziemlich zuverlässig von Menschen geschriebener Poesie unterscheiden. Bei der Poesie von ChatGPT 3.5 ist das nicht mehr möglich. Das Autorenteam fordert daher, umfassende Vorschriften zur Transparenz beim Einsatz von KI-Systemen umzusetzen.