Metoda DivInit zwiększa skuteczność agentów AI o 5–7 punktów przez dywersyfikację zapytań początkowych zamiast standardowego równoległego próbkowania.

Źródło zdjęcia: arXiv.org
Badacze z kilku czołowych uniwersytetów opublikowali nową metodę optymalizacji agentów AI wykorzystujących wyszukiwanie informacji. Praca zatytułowana „Beyond Parallel Sampling: Diverse Query Initialization for Agentic Search” została opublikowana 15 czerwca 2026 roku na platformie arXiv i obecnie przechodzi proces recenzji na konferencję EMNLP 2026.
Zespół badawczy pod kierownictwem Sidhaartha Murali zidentyfikował kluczowy problem w obecnych metodach skalowania agentów AI — standardowe równoległe próbkowanie prowadzi do malejących zwrotów z powodu redundancji zapytań w pierwszej turze wyszukiwania.
Autorzy badania wykazali, że tradycyjne podejście do skalowania agentów AI przez zwiększanie liczby równoległych rolloutów napotyka na fundamentalne ograniczenie. Gdy modele generują podobne zapytania w pierwszej turze, wszystkie wątki pobierają nakładające się dowody, a kolejne etapy są uwarunkowane tymi samymi informacjami wejściowymi.
To zjawisko szczególnie wpływa na skalowanie „wszerz” (breadth scaling), które teoretycznie powinno poprawiać wyniki poprzez eksplorację większej przestrzeni możliwości. W praktyce jednak standardowe równoległe próbkowanie szybko osiąga punkt nasycenia, gdzie dodatkowe wątki nie wnoszą nowej wartości.
Proponowana metoda DivInit wprowadza inteligentną dywersyfikację na poziomie inicjalizacji zapytań. Zamiast generowania k niezależnych pierwszych zapytań, system:
Takie podejście zapewnia, że każdy wątek rozpoczyna od unikalnego punktu wyjścia, maksymalizując pokrycie przestrzeni wyszukiwania przy zachowaniu tego samego budżetu obliczeniowego.
Badacze przetestowali DivInit na pięciu modelach o otwartych wagach oraz ośmiu różnych benchmarkach. We wszystkich przypadkach metoda konsystentnie przewyższała standardowe równoległe próbkowanie. Szczególnie imponujące rezultaty osiągnięto w zadaniach wieloetapowego odpowiadania na pytania, gdzie średnie zyski wynosiły 5–7 punktów procentowych.
Kluczową zaletą DivInit jest brak konieczności dodatkowego trenowania — metoda działa jako training-free intervention, co oznacza, że może być natychmiast zastosowana w istniejących systemach bez modyfikacji parametrów modelu.
Praca przedstawia praktyczne rozwiązanie długotrwałego problemu w projektowaniu agentów AI i otwiera nowe możliwości optymalizacji systemów wyszukiwania informacji. Kod implementacji został udostępniony przez autorów, co ułatwi adopcję metody przez społeczność badawczą.

Nowy model Anthropic osiągnął 88% dokładności w FrontierMath tier 4, podczas gdy GPT-5.5 uzyskał 75%. Przełom w matematycznym rozumowaniu AI.
Programiści testują lokalne alternatywy dla komercyjnych modeli AI. Modele 30B+ osiągają przyzwoitą jakość, ale wymagają dużo cierpliwości i zasobów.

Administracja Trumpa utrzymała ograniczenia na model Claude Fable 5 mimo rozmów z Anthropic. NSA potwierdza możliwość obejścia zabezpieczeń modelu.