15 maja 20264 min czytania

Artykuły naukowe generowane przez AI stają się lepsze — i to ogromny problem dla nauki

Redakcje czasopism naukowych są zalewane AI-generowanymi artykułami coraz trudniejszymi do wykrycia. System peer-review może osiągnąć punkt krytyczny.

Źródło zdjęcia: The Verge

Poprzedni

CLIPR — nowy framework uczy AI preferencji użytkowników z minimalnych rozmów

Następny

GraphBit: nowy framework dla deterministycznej orkiestracji agentów AI osiąga 67,6% dokładności

Podobne Publikacje

Etyka i Bezpieczeństwo

Amerykanie sprzeciwiają się centrom danych AI w swoich okolicach

Badanie Gallup: 71% Amerykanów nie chce centrów danych AI w pobliżu. Główne obawy to zużycie wody i energii, rosnące rachunki za prąd.

3 min14 maja

Biznes i Rynek

OpenAI chce użyć statuetki osła jako dowodu w procesie przeciwko Muskowi

Prawnicy OpenAI złożyli wniosek o wykorzystanie złotej statuetki przedstawiającej pośladki osła jako dowodu w sprawie sądowej z Elonem Muskiem.

Kluczowe wnioski

Sztuczna inteligencja umożliwia masową produkcję artykułów naukowych, które są wystarczająco przekonujące, by przejść przez proces recenzji.

System peer-review, już wcześniej przeciążony, może osiągnąć punkt krytyczny z powodu lawinowego wzrostu liczby publikacji AI-generowanych.

Firmy oferują narzędzia do tworzenia publikacji w kilka godzin, wykorzystując publicznie dostępne bazy danych do generowania pozornie nowych badań.

Paradoksalnie, im lepsza staje się technologia AI, tym większy problem stanowi dla integralności nauki.

„Młyny publikacyjne” ewoluowały od prostych plagiatów do wyrafinowanych systemów wykorzystujących AI do omijania detektorów.

Ewolucja „młynów publikacyjnych”

Przez ostatnią dekadę wydawnictwa naukowe zmagały się z tzw. „paper mills” — firmami produkującymi masowo artykuły i sprzedającymi miejsce w autorach naukowcom potrzebującym publikacji. To była gra w kotka i myszkę — wydawcy, często pod presją „detektywów naukowych” specjalizujących się w wykrywaniu oszustw, zamykali jedną lukę, a młyny znajdowały nową.

AI początkowo pomagało młynom omijać detektory plagiatu przez tworzenie nowych obrazów i tekstów. Jednak charakterystyczne „halucynacje” technologii pozwalały teoretycznie na wykrywanie takiej produkcji. W praktyce artykuły nadal przechodziły, by później zostać wycofane po odkryciu diagramów szczurów z niewytłumaczalnie wielkimi narządami płciowymi opisanymi jako „testtomcels” lub tekstu z pozostawionymi frazami „as an AI assistant”.

Nowa era AI-generowanej nauki

Matt Spick, wykładowca na University of Surrey i redaktor w Scientific Reports, zauważył zjawisko po otrzymaniu trzech uderzająco podobnych artykułów analizujących amerykańską bazę danych NHANES. Sprawdzenie Google Scholar ujawniło nagły wzrost publikacji cytujących NHANES, wszystkie według podobnej formuły — każda rzekomo odkrywająca związek między na przykład jedzeniem orzechów włoskich a funkcjami poznawczymi czy piciem odtłuszczonego mleka a depresją.

„Jeśli masz wystarczającą moc obliczeniową, przechodzisz przez wszystko i mierzysz każdą parę powiązań, a w końcu znajdziesz takie, o których jeszcze nie pisano i po prostu publikujesz: jest korelacja między tym a tamtym” — wyjaśnia Spick. Te korelacje to często mylące uproszczenia zjawisk o wielu przyczynach lub przypadkowe fluktacje statystyczne.

Spick podaje absurdalny przykład: „Jedna z prac twierdziła, że liczba lat edukacji powoduje powikłania przepukliny pooperacyjnej. To po prostu przypadkowa korelacja. Co mam z tym zrobić? Wcześnie skończyć szkołę, żeby nie mieć później powikłań przepukliny pooperacyjnej?”

Problem polega na tym, że obecne AI może produkować przekonujące artykuły niemal hurtowo, pozwalając desperackim naukowcom samodzielnie produkować publikacje. Rezultatem jest potop naukowego „śmiecia”, który zagraża zalaniem systemu publikowania, recenzowania, przyznawania grantów i całego współczesnego systemu badawczego.