Przełomowy system automatycznie generuje i testuje reguły wyszukiwania prawnego, przewyższając tradycyjne metody na chińskim benchmarku.

Źródło zdjęcia: arXiv.org
Chińscy naukowcy opracowali samoewoluujący system sztucznej inteligencji, który automatycznie ulepszza wyszukiwanie spraw sądowych poprzez iteracyjne tworzenie i testowanie reguł. Badanie, opublikowane na arXiv, przedstawia przełomowe podejście do zastosowania AI w systemach prawnych.
Zespół pod kierownictwem Mingxu Tao z ośmiu chińskich instytucji naukowych stworzył framework, który wykorzystuje duże modele językowe (LLM) do automatycznego generowania reguł przepisywania zapytań. System został przetestowany na chińskim benchmarku wyszukiwania spraw prawnych LeCaRD-v2, znacząco przewyższając tradycyjne metody.
Wyszukiwanie spraw sądowych pozostaje wyzwaniem ze względu na złożoność języka prawnego i potrzebę precyzyjnego dopasowania leksykalnego między zapytaniami a relewatnymi sprawami. Mimo postępów w modelach gęstego wyszukiwania (dense retrieval), badania empiryczne pokazują, że algorytm BM25 nadal stanowi silną podstawę w tej dziedzinie.
To spostrzeżenie zmotywowało naukowców do zaproponowania samoewoluującego frameworka opartego na regułach przepisywania zapytań, który wzmacnia BM25 bez konieczności trenowania parametrów. System wyposaża agenta opartego na LLM w automatyczne środowisko ewaluacji.
Framework umożliwia agentowi iteracyjne tworzenie reguł przepisywania, planowanie eksperymentów walidacyjnych nad kombinacjami reguł oraz eliminację nieskutecznych reguł na podstawie historycznych informacji zwrotnych. Kluczową innowacją jest zdolność systemu do uczenia się na podstawie własnych doświadczeń.
Szczegółowe analizy przeprowadzone przez zespół badawczy ujawniły mechanizmy leżące u podstaw samoewolucji. Zdolności LLM do wykorzystywania poprzednich wyników eksperymentów oraz jego wrodzona wiedza o eliminacji reguł odgrywają krytyczne role w udoskonalaniu zestawu reguł poprzez samoewolucję.
System został przetestowany na chińskim benchmarku LeCaRD-v2, wykazując przewagę nad metodami nieewolucyjnymi. Szczególnie impressywne wyniki osiągnięto przy wykorzystaniu zaawansowanych modeli LLM jako podstawowego silnika systemu.
Badanie przedstawia znaczący krok w kierunku autonomicznych systemów AI zdolnych do samodzielnego ulepszania swoich możliwości w wyspecjalizowanych domenach prawnych. Publikacja na prestižowej konferencji ACL 2026 podkreśla wagę tego osiągnięcia dla przyszłości sztucznej inteligencji w aplikacjach prawniczych.

Decyzja Anthropic o zawieszeniu dostępu do modeli Fable 5 i Mythos 5 wywołała debatę w Indiach o niezależności technologicznej i rozwoju krajowych rozwiązań AI.

Nowe badanie ujawnia słabość agentów AI w kodowaniu — pokrywają tylko 14–19% istotnych linijek kodu, choć dobrze radzą sobie z wyszukiwaniem plików.

Google Cloud prezentuje OKF — nowy standard przekształcający rozproszoną wiedzę organizacyjną w pliki Markdown dostępne dla agentów AI.