Robert Klatt
Large Language Models (LLM) wie ChatGPT übertreffen die Kreativität der meisten Menschen in vielen standardisierten Tests bereits. Die kreativsten Menschen erzielen aber noch immer deutlich bessere Ergebnisse als die Künstliche Intelligenz (KI).
Montreal (Kanada). Künstliche Intelligenz (KI), im Speziellen Large Language Models (LLM) wie ChatGPT, übertreffen Menschen bereits in vielen Bereichen, laut einer Studie der New York University Abu Dhabi (NYUAD) etwa Studenten in Prüfungsfragen in unterschiedlichen Fachrichtungen wie Informatik, Politik, Ingenieurwissenschaften und Psychologie. Wissenschaftler der Universität Montreal haben nun untersucht, ob KIs auch kreativ sein können, also eine Leistung erbringen können, die die Mathematikerin Ada Lovelace im 19. Jahrhundert für unmöglich gehalten hat.
Die Forscher haben die LLMs ChatGPT, Claude, Gemini standardisierte Kreativitätstests absolvieren lassen, darunter unterschiedliche Aufgabenstellungen wie das kreative Schreiben. Im Fokus der ersten großen Studie in diesem Bereich stand ein relativ simpler Test, der die divergente Kreativität misst. Es handelt sich dabei um eine Aufgabe, in der Wörter aufgeschrieben werden, die sich sprachlich möglichst stark voneinander unterscheiden sollen. Die Ergebnisse der KIs wurden anschließend mit den Ergebnissen von rund 100.000 Menschen verglichen.
Neben dem Test zur divergenten Kreativität, die in der Wissenschaft als einfache Alternative zu anderen, etablierten Messmethoden für die Kreativität gilt, haben die KIs und die menschlichen Probanden weitere Tests absolviert, darunter das Schreiben von Haikus und Flash Fiction sowie das Erstellen einer Kurzzusammenfassung einer Geschichte (Synopse). Die Auswertung der Ergebnisse zeigt deutlich, dass LLMs nicht mehr mit Menschen mithalten können, sondern deren Kreativität oft sogar übertreffen.
„Unsere Studie zeigt, dass einige KI-Systeme, die auf großen Sprachmodellen basieren, bei klar definierten Aufgaben mittlerweile die durchschnittliche menschliche Kreativität übertreffen können.“
Die kreativsten Menschen erzielen aber noch immer deutlich bessere Ergebnisse als die LLMs.
„Selbst die besten KI-Systeme erreichen immer noch nicht das Niveau der kreativsten Menschen.“
Zudem zeigt die Studie, dass die Kreativität der KI nicht immer gleich ist, sondern stark von ihren Einstellungen beeinflusst wird. Wenn man die sogenannte „Temperatur“ bei ChatGPT erhöht, wird das LLM deutlich kreativer und erzielt ausgefallenere Ergebnisse. Die Antworten werden jedoch auch zufälliger und können mehr Halluzinationen enthalten, also fehlerhafte Informationen.
Wie die Forscher erklären, könnten die Ergebnisse zudem ein Hinweis darauf sein, dass sich Kreativität nicht so simpel objektiv messen lässt, wie die Forschung bisher angenommen hat. Es ist demnach denkbar, dass die Ergebnisse nicht valide sind, weil die bisher bekannten Messmethoden für Kreativität falsch sind. Das Team um Karim Jerbi ist deshalb der Ansicht, dass KI bisher nur ein Werkzeug ist, dessen kreative Fähigkeiten von Menschen genutzt werden können, diese aber noch nicht ersetzen.
„Auch wenn KI mittlerweile in bestimmten Tests die Kreativität des Menschen erreichen kann, müssen wir dieses irreführende Wettbewerbsdenken hinter uns lassen. Sie wird Kreative nicht ersetzen, sondern die Art und Weise, wie sie denken, forschen und gestalten, grundlegend verändern, zumindest für diejenigen, die sich dafür entscheiden, sie zu nutzen.“
Quellen:
Pressemitteilung der Universität Montreal
Studie im Fachmagazin Scientific Reports, doi: 10.1038/s41598-025-25157-3