7 artykułów z tym tagiem
NVIDIA współpracuje z londyńskim laboratorium AI Davida Silvera przy tworzeniu infrastruktury dla systemów uczących się z doświadczenia na wielką skalę.
Naukowcy opracowali MAVIC — metodę pozwalającą wieloagentowym systemom AI lepiej reagować na instrukcje przerywające bieżące zadania.
Naukowcy opracowali RankQ — metodę uczenia ze wzmocnieniem, która poprawia skuteczność robotów o 42,7% dzięki inteligentnemu rankowaniu działań.
ARR zastępuje nieprzeźroczyste sygnały nagrody strukturalnymi kryteriami, przewyższając tradycyjne metody w testach generowania obrazów.
Badacze opracowali RETD — algorytm eliminujący niestabilność w uczeniu temporalnych różnic przy zachowaniu korzystnej geometrii emfatycznej.
ServiceNow AI opisuje cztery kluczowe poprawki potrzebne do migracji z vLLM V0 do V1 w kontekście trenowania modeli RL.
Startup z MIT demonstruje roboty manipulujące przedmiotami z naturalną płynnością, wykorzystując uczenie ze wzmocnieniem do przełamania bariery symulacji.