Die rasante Entwicklung im Bereich der Künstlichen Intelligenz (KI) hat dazu geführt, dass KI-generierte Texte immer menschlicher wirken. Dies stellt eine Herausforderung dar, wenn es darum geht, die Quelle eines Textes zu identifizieren. Eine neue Studie von Forschern der Universität Tübingen und der Northwestern University in Illinois hat nun gezeigt, dass bestimmte Wörter häufiger in KI-generierten Texten vorkommen und somit helfen können, diese zu erkennen.
Die Forscher haben eine umfangreiche Analyse durchgeführt, bei der sie sämtliche Kurzreferate der Datenbank Pubmed bis Ende Juni 2024 heruntergeladen und untersucht haben. Dabei stellten sie fest, dass seit der weiten Verfügbarkeit von KI bestimmte Wörter deutlich häufiger auftreten. Zu den am häufigsten verwendeten Wörtern gehören „delves“ (zu Deutsch: erforschen, vertiefen), „showcasing“ (zu Deutsch: präsentieren) und „underscores“ (zu Deutsch: unterstreichen). Diese Wörter treten seit der Einführung von KI-Tools in wissenschaftlichen Publikationen bis zu 25-mal häufiger auf als zuvor.
Um sicherzustellen, dass die Veränderungen in der Wortfrequenz nicht durch natürliche Sprachentwicklungen oder globale Ereignisse wie die Corona-Pandemie beeinflusst wurden, haben die Wissenschaftler andere signifikante Wortanstiege in der Vergangenheit untersucht. Dabei fanden sie heraus, dass die Häufigkeit der identifizierten Wörter nicht mit solchen Ereignissen korreliert. Daraus schließen sie, dass rund zehn Prozent der Kurzreferate nach 2022 mit Hilfe von KI erstellt wurden.
Die Forscher betonen, dass die beobachteten Änderungen auch auf die natürliche Evolution der Sprache zurückzuführen sein könnten. Jedoch konnten sie diese Möglichkeit durch den Vergleich mit historischen Daten ausschließen. Die Ergebnisse deuten darauf hin, dass KI-generierte Texte immer häufiger in wissenschaftlichen Arbeiten verwendet werden, was die Frage aufwirft, wie diese Texte in Zukunft erkannt und bewertet werden sollen.
Neben der direkten Erkennung durch häufig verwendete Wörter vermuten die Forscher, dass einige Wissenschaftler die Füllwörter der KI erkannt haben und diese vor der Veröffentlichung entfernen, um die Nutzung von KI zu verschleiern. Dies könnte bedeuten, dass der tatsächliche Anteil von KI-generierten Texten noch höher ist, als die Studie vermuten lässt.
Die Ergebnisse der Studie werfen wichtige Fragen auf: Wie können wir sicherstellen, dass wissenschaftliche Arbeiten authentisch sind und nicht durch KI manipuliert werden? Welche Maßnahmen sollten ergriffen werden, um die Transparenz in der wissenschaftlichen Kommunikation zu gewährleisten? Die Forscher fordern weitere Untersuchungen und die Entwicklung von Methoden, um KI-generierte Texte zuverlässig zu erkennen.
Die Studie zeigt, dass bestimmte Wörter häufiger in KI-generierten Texten vorkommen und somit Hinweise auf deren Ursprung geben können. Dies eröffnet neue Möglichkeiten zur Erkennung und Bewertung von KI-generierten Inhalten. Gleichzeitig wird deutlich, dass die Nutzung von KI in der Wissenschaft weiter zunehmen wird, was neue Herausforderungen und Chancen mit sich bringt.
Bibliographie: - https://hackernoon.com/de/wie-man-durch-k%C3%BCnstliche-Intelligenz-generierten-Text-erkennt - https://www.mind-verse.de/news/erkennung-von-ki-generierten-texten-durch-analyse-haeufiger-woerter - https://www.dotnetpro.de/tools/noplagiat-tool-erkennt-ki-generierte-texte-2905558.html - https://blog.hubspot.de/marketing/ki-texte-erkennen - https://kopfundstift.de/ki-texte-erkennen-tools/ - https://www.heise-regioconcept.de/online-marketing/ki-texte-erkennen - https://neuroflash.com/de/blog/ki-texte-erkennen/ - https://omr.com/de/reviews/contenthub/ki-texte-erkennen - https://www.bigdata-insider.de/ki-generierte-texte-zuverlaessig-erkennen-a-867df3b546b543306b3b69ed6daaceb6/