Badacze opracowali BALAR — algorytm umożliwiający AI strukturalne prowadzenie rozmów i zadawanie celnych pytań doprecyzowujących.

Źródło zdjęcia: arXiv.org
Zespół badaczy z University of Washington opublikował nową metodę usprawniania interakcji między użytkownikami a dużymi modelami językowymi. Algorytm BALAR (Bayesian Agentic Loop for Active Reasoning) ma umożliwić AI bardziej strukturalne prowadzenie wieloetapowych rozmów i zadawanie pytań doprecyzowujących. Szczegóły badania zostały opublikowane w artykule naukowym na arXiv.
Większość obecnych systemów AI traktuje dialog reaktywnie i nie posiada zasadniczego mechanizmu rozumowania o tym, jakie informacje są brakujące i które pytanie powinno zostać zadane jako następne. Duże modele językowe coraz częściej działają w interaktywnych środowiskach, gdzie rozwiązanie zadania wymaga wielu rund wymiany informacji z użytkownikiem.
Autorzy badania — Aymen Echarghaoui, Dongxia Wu i Emily B. Fox — zidentyfikowali tę lukę jako kluczowy problem ograniczający efektywność obecnych systemów konwersacyjnych.
BALAR to algorytm zewnętrznej pętli, który działa niezależnie od konkretnych zadań i nie wymaga fine-tuningu. System utrzymuje strukturalne przekonania o ukrytych stanach i wybiera pytania doprecyzowujące poprzez maksymalizację oczekiwanej wzajemnej informacji.
Kluczową innowacją jest zdolność dynamicznego rozszerzania reprezentacji stanu, gdy obecna okazuje się niewystarczająca do rozwiązania problemu. To podejście bayesowskie pozwala systemowi na bardziej principialne podejście do prowadzenia dialogu.
Badacze przetestowali BALAR na trzech różnorodnych benchmarkach: AR-Bench-DC (sprawy detektywistyczne), AR-Bench-SP (zagadki logiczne) i iCraft-MD (diagnoza kliniczna). We wszystkich przypadkach algorytm znacząco przewyższył wszystkie punkty odniesienia.
BALAR to pierwszy krok w kierunku bardziej inteligentnych systemów konwersacyjnych, które potrafią aktywnie zbierać informacje potrzebne do rozwiązania złożonych problemów.

Badanie największej organizacji pisarzy USA pokazuje dramatyczne różnice między detektorami AI — od 100% skuteczności do całkowitej porażki.

Anthropic i OpenAI wydały łącznie 27 mln dolarów walcząc o wpływ na regulacje AI w kongresowych prawyborach. Alex Bores przegrał nieznacznie z Lasher.

AI pozwala cyberprzestępcom tworzyć bardziej wiarygodne oszustwa przed największymi Mistrzostwami Świata w historii. Zarejestrowano już ponad 13 000 podejrzan