Naukowcy opracowali DeepER-Med — system AI zapewniający przejrzysty proces oceny dowodów naukowych w medycynie z 87,5% zgodnością z rekomendacjami klinicznymi.

Źródło zdjęcia: arXiv.org

Badanie pokazuje, jak analizować wielokrotne odpowiedzi modeli językowych zamiast pojedynczych wyników. Nowe narzędzie GROVE poprawia ocenę różnorodności AI.

MIT Technology Review zaprezentowało listę kluczowych technologii AI na 2026 rok podczas transmisji EmTech AI dla subskrybentów i absolwentów MIT.
Zespół naukowców z międzynarodowych instytucji opracował DeepER-Med — zaawansowany system sztucznej inteligencji do wspomagania badań medycznych opartych na dowodach. Badanie opublikowane na arXiv przedstawia framework składający się z trzech modułów: planowania badań, współpracy agentów AI oraz syntezy dowodów naukowych.
System został zaprojektowany z myślą o zwiększeniu przejrzystości i wiarygodności AI w medycynie — kluczowych czynnikach dla szerokiej adopcji tej technologii przez klinicystów i badaczy.
DeepER-Med składa się z trzech kluczowych modułów działających w sekwencji. Pierwszy moduł — planowanie badań — definiuje strategię wyszukiwania i oceny literatury naukowej. Drugi moduł wykorzystuje współpracę między wieloma agentami AI do przeprowadzenia wieloetapowego wyszukiwania informacji, rozumowania i analizy. Trzeci moduł zajmuje się syntezą zebranych dowodów w spójne wnioski badawcze.
Kluczową innowacją jest wprowadzenie jawnych i możliwych do inspekcji kryteriów oceny dowodów naukowych. Większość istniejących systemów nie oferuje takiej przejrzystości, co stwarza ryzyko kumulowania błędów i utrudnia badaczom oraz klinikom ocenę wiarygodności wyników.
Do oceny skuteczności systemu zespół stworzył dataset DeepER-MedQA zawierający 100 pytań badawczych na poziomie eksperckim. Pytania zostały opracowane przez multidyscyplinarny panel 11 ekspertów biomedycznych i pochodzą z rzeczywistych scenariuszy badań medycznych.
Manualna ocena przeprowadzona przez ekspertów wykazała, że DeepER-Med konsekwentnie przewyższa szeroko stosowane platformy komercyjne w wielu kryteriach, w tym w zdolności do generowania nowatorskich odkryć naukowych.
Dodatkowo system został przetestowany w ośmiu rzeczywistych przypadkach klinicznych. Ocena przeprowadzona przez klinicystów pokazała, że wnioski DeepER-Med były zgodne z rekomendacjami klinicznymi w siedmiu przypadkach, co podkreśla potencjał systemu w badaniach medycznych i wspomaganiu decyzji klinicznych.
DeepER-Med reprezentuje znaczący krok naprzód w kierunku stworzenia wiarygodnych i przejrzystych systemów AI dla medycyny, oferując narzędzie, które może wspierać zarówno badaczy, jak i praktykujących lekarzy w podejmowaniu decyzji opartych na solidnych dowodach naukowych.