arXiv zbanuje autorów na rok za niekontrolowane prace generowane przez AI
Wpływowy repozytorium preprintów arXiv nałoży roczne zakazy dla badaczy, którzy przesyłają prace zawierające wyraźne dowody na niekontrolowaną treść generowaną przez AI, nasilając wysiłki w celu ograniczenia niskiej jakości badań wspomaganych przez LLM.

arXiv, szeroko stosowane repozytorium open-access dla preprintów prac badawczych, zaostrza swoje polityki dotyczące wykorzystania dużych modeli językowych (LLM) w przesłaniach naukowych. Platforma ogłosiła, że autorzy przesyłający prace zawierające wyraźne dowody na niekontrolowaną treść wygenerowaną przez AI mogą zostać zdyskwalifikowani na rok.
Eskalacja egzekwowania wobec niskiej jakości treści AI
Mimo że prace na arXiv nie są recenzowane przed opublikowaniem, repozytorium odgrywa kluczową rolę w rozpowszechnianiu badań w różnych dyscyplinach, takich jak informatyka, matematyka i fizyka. W wielu dziedzinach służy jako główny kanał szybkiego dystrybuowania badań i miernik emerging trends.
W ostatnich miesiącach moderatorzy arXiv zgłaszali rosnącą liczbę niskiej jakości przesłań generowanych przy pomocy LLM. Choć narzędzia AI mogą pomagać w tworzeniu i edycji, wzrosły obawy dotyczące prac zawierających сфабриковане cytowania, urojenia wyników, plagiat tekstu czy nawet pozostałości promptów i dialogów z botem czatowym osadzone w manuskrypcie.
Zgodnie z nową polityką, jeśli przesłanie zawiera "niepodważalne dowody", że autorzy nie zweryfikowali materiału wygenerowanego przez AI, arXiv nałoży zakaz publikacji na rok. Po upływie okresu zakazu, wszystkie nowe przesłania od tych autorów muszą najpierw zostać zaakceptowane przez renomowane recenzowane miejsce publikacji, zanim będą mogły zostać opublikowane na arXiv.
Odpowiedzialność, a nie zakaz AI
Polityka ta nie zabrania całkowicie korzystania z narzędzi AI. Zamiast tego arXiv podkreśla odpowiedzialność autora. Badacze nadal mogą swobodnie korzystać z LLM w tworzeniu lub analizie, ale muszą ponosić pełną odpowiedzialność za dokładność, integralność i oryginalność swojej pracy.
Różnica jest istotna. arXiv nie postrzega się jako anty-AI; raczej reaguje na to, co moderatorzy określają jako lekkomyślne lub niesprawdzone wykorzystanie systemów generatywnych. Urojone cytowania i niesprawdzone dane wyjściowe podważają zaufanie do repozytorium, które w dużej mierze opiera się na moderacji społecznościowej i wiarygodności mimo statusu preprintu.
Zmiany strukturalne i narastające presje
Ścisłe egzekwowanie ma miejsce w okresie przejściowym dla organizacji. Po ponad dwóch dekadach opieki Uniwersytetu Cornella, arXiv przechodzi proces stania się niezależną instytucją non-profit. Większa niezależność instytucjonalna może zapewnić dodatkową elastyczność i finansowanie do rozwiązywania problemów moderacyjnych, w tym tych wprowadzonych przez AI generatywną.
arXiv już wdrożył środki takie jak wymóg uzyskania poparcia od ugruntowanych współpracowników przez nowych przesyłających. Nowy mechanizm egzekwowania sygnalizuje silniejsze podejście odstraszające, ponieważ teksty generowane przez AI stają się bardziej wyrafinowane i trudniejsze do wykrycia.
Szeroka chwila integralności badań
Decyzja odzwierciedla szersze rozliczenie w środowisku akademickim, jak zintegrować AI generatywną z przepływem pracy badawczą. Uniwersytety, czasopisma i instytucje finansujące rywalizują w definiowaniu akceptowalnych polityk użytkowania. Ruch arXiv jest godny uwagi ze względu na jego skalę i wpływ: polityki przyjęte tam często rozprzestrzeniają się na globalny ekosystem badawczy.
Drawing firm line around unchecked automation rather than AI usage itself, arXiv próbuje zachować integralność badań bez tłumienia eksperymentowania technologicznego. Komunikat skierowany do badaczy jest jasny: AI może wspierać, ale odpowiedzialności nie można zlecać.