arXiv wird Autoren für ein Jahr sperren wegen unüberprüfter KI-generierter Arbeiten
Das einflussreiche Preprint-Repository arXiv wird einjährige Sperren gegen Forscher verhängen, die Arbeiten einreichen, die klare Anzeichen für unüberprüfte KI-generierte Inhalte enthalten, und damit Maßnahmen zur Eindämmung von minderwertiger LLM-unterstützter Forschung verschärfen.

arXiv, das weit verbreitete Open-Access-Repositorium für vorab veröffentlichte Forschungsarbeiten, verschärft seine Richtlinien zur Nutzung großer Sprachmodelle (LLMs) bei wissenschaftlichen Einreichungen. Die Plattform verkündete, dass Autoren, die Arbeiten einreichen, die klare Anzeichen für nicht überprüften, von KI generierten Inhalt enthalten, mit einem einjährigen Ausschluss rechnen müssen.
Strengere Durchsetzung gegen minderwertige KI-Inhalte
Obwohl arXiv-Arbeiten vor der Veröffentlichung nicht begutachtet werden, spielt das Repositorium eine zentrale Rolle bei der Verbreitung von Forschungsergebnissen in Disziplinen wie Informatik, Mathematik und Physik. In vielen Bereichen dient es als primärer Kanal für schnelle Forschungsverbreitung und als Gradmesser für aufkommende Trends.
In den letzten Monaten haben Moderatoren von arXiv über eine zunehmende Zahl von minderwertigen Einreichungen berichtet, die mithilfe von LLMs erstellt wurden. Während KI-Tools bei der Erstellung und Bearbeitung helfen können, häufen sich Bedenken hinsichtlich Arbeiten, die gefälschte Referenzen, erfundene Ergebnisse, plagiierte Texte oder sogar übrig gebliebene Prompts und Chatbot-Dialoge im Manuskript enthalten.
Laut der neuen Regelung wird arXiv einen einjährigen Ausschluss verhängen, wenn eine Einreichung „unwiderlegbare Beweise“ dafür enthält, dass die Autoren nicht überprüftes KI-generiertes Material verwendet haben. Nach Ablauf des Ausschlusses müssen alle neuen Einreichungen dieser Autoren zunächst von einer renommierten, begutachteten Publikationsstätte akzeptiert werden, bevor sie auf arXiv veröffentlicht werden dürfen.
Verantwortlichkeit, kein KI-Verbot
Die Regelung verbietet die Nutzung von KI-Tools nicht grundsätzlich. Vielmehr betont arXiv die Verantwortung der Autoren. Forscher dürfen weiterhin LLMs beim Verfassen oder Analysieren nutzen, doch sie sind dafür verantwortlich, die Richtigkeit, Integrität und Originalität ihrer Arbeit zu gewährleisten.
Der Unterschied ist entscheidend. arXiv positioniert sich nicht als KI-feindlich, sondern reagiert vielmehr auf das, was Moderatoren als sorglose oder nicht überprüfte Nutzung generativer Systeme beschreiben. Fingierte Zitate und ungeprüfte Ausgaben untergraben das Vertrauen in das Repositorium, das trotz seines Preprint-Status stark auf Community-Moderation und Glaubwürdigkeit angewiesen ist.
Strukturelle Veränderungen und steigender Druck
Die Verschärfung erfolgt während einer Übergangsphase der Organisation. Nach mehr als zwei Jahrzehnten unter der Trägerschaft der Cornell University befindet sich arXiv gerade dabei, eine eigenständige gemeinnützige Einrichtung zu werden. Größere institutionelle Unabhängigkeit könnte zusätzliche Flexibilität und Finanzierungsmittel bieten, um Moderationsherausforderungen zu bewältigen, einschließlich solcher, die durch generative KI entstehen.
arXiv hat bereits Maßnahmen wie die Anforderung eingeführt, dass Ersteinreicher von etablierten Beitragenden bestätigt werden müssen. Der neue Vollzugmechanismus signalisiert einen stärkeren abschreckenden Ansatz, da KI-generierter Text immer ausgefeilter wird und schwerer zu erkennen ist.
Ein Moment größerer Forschungsintegrität
Die Entscheidung spiegelt eine breitere Auseinandersetzung innerhalb der Wissenschaft wider, wie generative KI in Forschungsprozesse integriert werden soll. Universitäten, Zeitschriften und Förderorganisationen bemühen sich, akzeptable Nutzungsrichtlinien zu definieren. arXivs Vorgehen ist aufgrund seiner Größe und Reichweite besonders bemerkenswert: Dort eingeführte Regeln wirken oft auf das globale Forschungssystem durch.
Indem arXiv eine klare Linie zwischen unkontrollierter Automatisierung und KI-Nutzung zieht, versucht es, die Forschungsintegrität zu erhalten, ohne technologisches Experimentieren einzuschränken. Die Botschaft an Forscher ist klar: KI kann unterstützen, aber Verantwortung lässt sich nicht auslagern.