17 czerwca 20264 min czytania

Naukowcy rozwiązali problem redundancji w agentach AI wyszukujących informacje

Metoda DivInit zwiększa skuteczność agentów AI o 5–7 punktów przez dywersyfikację zapytań początkowych zamiast standardowego równoległego próbkowania.

Źródło zdjęcia: arXiv.org

Badacze z kilku czołowych uniwersytetów opublikowali nową metodę optymalizacji agentów AI wykorzystujących wyszukiwanie informacji. Praca zatytułowana „Beyond Parallel Sampling: Diverse Query Initialization for Agentic Search” została opublikowana 15 czerwca 2026 roku na platformie arXiv i obecnie przechodzi proces recenzji na konferencję EMNLP 2026.

Zespół badawczy pod kierownictwem Sidhaartha Murali zidentyfikował kluczowy problem w obecnych metodach skalowania agentów AI — standardowe równoległe próbkowanie prowadzi do malejących zwrotów z powodu redundancji zapytań w pierwszej turze wyszukiwania.

Kluczowe wnioski

Standardowe równoległe próbkowanie w agentach AI generuje podobne pierwsze zapytania, co prowadzi do nakładających się wyników wyszukiwania i ogranicza skuteczność całego procesu.
Metoda DivInit wprowadza dywersyfikację już na pierwszym etapie — zamiast k niezależnych zapytań, generuje n kandydatów i wybiera k najbardziej zróżnicowanych jako podstawę równoległych trajektorii.
Testy na pięciu modelach open-source i ośmiu benchmarkach pokazują konsystentną poprawę nad standardowym próbkowaniem równoległym.
Średnie zyski wynoszą 5–7 punktów procentowych w zadaniach wieloetapowego odpowiadania na pytania przy tym samym nakładzie obliczeniowym.
DivInit nie wymaga dodatkowego trenowania i może być zastosowane jako gotowa interwencja w istniejących systemach.

Problem redundancji w równoległym próbkowaniu

Autorzy badania wykazali, że tradycyjne podejście do skalowania agentów AI przez zwiększanie liczby równoległych rolloutów napotyka na fundamentalne ograniczenie. Gdy modele generują podobne zapytania w pierwszej turze, wszystkie wątki pobierają nakładające się dowody, a kolejne etapy są uwarunkowane tymi samymi informacjami wejściowymi.

To zjawisko szczególnie wpływa na skalowanie „wszerz” (breadth scaling), które teoretycznie powinno poprawiać wyniki poprzez eksplorację większej przestrzeni możliwości. W praktyce jednak standardowe równoległe próbkowanie szybko osiąga punkt nasycenia, gdzie dodatkowe wątki nie wnoszą nowej wartości.

Metodologia DivInit

Proponowana metoda DivInit wprowadza inteligentną dywersyfikację na poziomie inicjalizacji zapytań. Zamiast generowania k niezależnych pierwszych zapytań, system:

Pobiera n kandydatów z pojedynczego wywołania modelu (gdzie n > k)
Wybiera k najbardziej zróżnicowanych kandydatów jako „ziarna”
Uruchamia je jako równoległe trajektorie

Takie podejście zapewnia, że każdy wątek rozpoczyna od unikalnego punktu wyjścia, maksymalizując pokrycie przestrzeni wyszukiwania przy zachowaniu tego samego budżetu obliczeniowego.

Wyniki eksperymentów

Badacze przetestowali DivInit na pięciu modelach o otwartych wagach oraz ośmiu różnych benchmarkach. We wszystkich przypadkach metoda konsystentnie przewyższała standardowe równoległe próbkowanie. Szczególnie imponujące rezultaty osiągnięto w zadaniach wieloetapowego odpowiadania na pytania, gdzie średnie zyski wynosiły 5–7 punktów procentowych.

Kluczową zaletą DivInit jest brak konieczności dodatkowego trenowania — metoda działa jako training-free intervention, co oznacza, że może być natychmiast zastosowana w istniejących systemach bez modyfikacji parametrów modelu.

Praca przedstawia praktyczne rozwiązanie długotrwałego problemu w projektowaniu agentów AI i otwiera nowe możliwości optymalizacji systemów wyszukiwania informacji. Kod implementacji został udostępniony przez autorów, co ułatwi adopcję metody przez społeczność badawczą.

#optymalizacja #agenci AI #wyszukiwanie informacji #DivInit

Udostępnij

Źródła

arXiv AI

Poprzedni

Naukowcy definiują dobre wyjaśnienia AI i analizują trudności z modelami językowymi

Następny

AlphaFold 3 osiąga 99% dokładność w przewidywaniu struktury białek

Podobne Publikacje

Modele AI

Claude Fable 5 wyprzedza GPT-5.5 o 13 punktów w najtrudniejszych zadaniach matematycznych

Nowy model Anthropic osiągnął 88% dokładności w FrontierMath tier 4, podczas gdy GPT-5.5 uzyskał 75%. Przełom w matematycznym rozumowaniu AI.

3 min13 czerwca

Poradniki

Czy lokalne modele AI mogą zastąpić Claude i GPT w programowaniu?

Programiści testują lokalne alternatywy dla komercyjnych modeli AI. Modele 30B+ osiągają przyzwoitą jakość, ale wymagają dużo cierpliwości i zasobów.

4 min15 czerwca

Etyka i Bezpieczeństwo

Anthropic pozostaje w sporze z Białym Domem ws. kontroli eksportowych Claude Fable 5

Administracja Trumpa utrzymała ograniczenia na model Claude Fable 5 mimo rozmów z Anthropic. NSA potwierdza możliwość obejścia zabezpieczeń modelu.

4 min16 czerwca

Kluczowe wnioski

Standardowe równoległe próbkowanie w agentach AI generuje podobne pierwsze zapytania, co prowadzi do nakładających się wyników wyszukiwania i ogranicza skuteczność całego procesu.

Metoda DivInit wprowadza dywersyfikację już na pierwszym etapie — zamiast k niezależnych zapytań, generuje n kandydatów i wybiera k najbardziej zróżnicowanych jako podstawę równoległych trajektorii.

Testy na pięciu modelach open-source i ośmiu benchmarkach pokazują konsystentną poprawę nad standardowym próbkowaniem równoległym.

Średnie zyski wynoszą 5–7 punktów procentowych w zadaniach wieloetapowego odpowiadania na pytania przy tym samym nakładzie obliczeniowym.

DivInit nie wymaga dodatkowego trenowania i może być zastosowane jako gotowa interwencja w istniejących systemach.

Problem redundancji w równoległym próbkowaniu

Metodologia DivInit

Proponowana metoda DivInit wprowadza inteligentną dywersyfikację na poziomie inicjalizacji zapytań. Zamiast generowania k niezależnych pierwszych zapytań, system:

Pobiera n kandydatów z pojedynczego wywołania modelu (gdzie n > k)

Wybiera k najbardziej zróżnicowanych kandydatów jako „ziarna”

Uruchamia je jako równoległe trajektorie

Takie podejście zapewnia, że każdy wątek rozpoczyna od unikalnego punktu wyjścia, maksymalizując pokrycie przestrzeni wyszukiwania przy zachowaniu tego samego budżetu obliczeniowego.

Wyniki eksperymentów