Startup z MIT demonstruje roboty manipulujące przedmiotami z naturalną płynnością, wykorzystując uczenie ze wzmocnieniem do przełamania bariery symulacji.

Źródło zdjęcia: WIRED

NVIDIA prezentuje Nemotron 3 Nano Omni — pierwszy otwarty model multimodalny, który osiąga 9x wyższą przepustowość niż konkurencja w agentach AI.

Badacze opracowali system agentów AI zdolny do odtwarzania wyników z nauk społecznych na podstawie samego opisu metodologii i surowych danych.
Startup Eka Robotics z Cambridge w Massachusetts demonstruje roboty o niezwykłej zręczności, które potrafią naturalnie manipulować przedmiotami — od wkręcania żarówek po podnoszenie kluczy. Firma wykorzystuje symulację i uczenie ze wzmocnieniem, aby przełamać barierę między wirtualną a rzeczywistą manipulacją. Szczegóły badań można znaleźć w raporcie WIRED.
Podczas wizyty w biurze Eka w Kendall Square obserwacja robota wkręcającego żarówkę wywołała wrażenie podobne do pierwszego kontaktu z ChatGPT. Robot początkowo pędził w kierunku żarówki, ale nagle zwolnił i zaczął ostrożnie szukać po stole, jak gdyby szukał okularów na nocnym stoliku. Delikatnie uchwycił żarówkę między szczypce, a gdy ta się wytoczyła, gonił ją po stole, aż w końcu udało mu się ją wkręcić.
W małym biurze firmy, kilka pięter nad restauracją Shy Bird, stoją różne ramiona robotyczne, chwytaki i stoły pokryte przedmiotami o różnych kształtach i fakturach — rękawiczki, pudełka ze słuchawkami, szczotki do włosów, breloki. Każdy przedmiot robot podnosi z podobną delikatnością, „szczypie” go kilka razy przed uchyceniem i podniesieniem.
Jak zauważył austriacki informatyk Hans Moravec pod koniec lat 80., zadania które wydają się nam najtrudniejsze, są dziecinnie proste dla maszyn, podczas gdy rzeczy wykonywane przez dzieci bez zastanowienia często stanowią wyzwanie dla robotów. Zdolność do interakcji z fizycznym światem ewoluowała tak dawno, że dla ludzi jest wrodzona — bardziej niż „wyższe” formy rozumowania.
W październiku 2018 roku OpenAI stworzył Dactyl — robotyczną rękę wykorzystującą AI do rozwiązywania kostki Rubika. Firma wzięła gotową rękę od Shadow Robot i stworzyła szczegółową symulację jej stawów, serwomechanizmów i silników. Używając uczenia ze wzmocnieniem, OpenAI trenował sztuczną sieć neuronową do manipulowania wirtualną kostką przez tysiące powtórzeń.
Choć OpenAI twierdzono, że Dactyl osiągnął „zręczność niemal na poziomie ludzkim”, robot miał znaczące ograniczenia. Nie potrafił się dostosować, gdy kostka zaczynała się wysuwać z chwytu, wymagał precyzyjnego ustawienia rąk i mógł manipulować tylko kostką Rubika — i to nie standardową, lecz wyposażoną w czujniki śledzące ruch kwadratów.
Kilka lat później OpenAI porzucił prace nad robotiką, skupiając się na dużych modelach językowych. Agrawal, który pozostaje w kontakcie z członkami zespołu Dactyl, mówi, że podejście symulacyjne projektu uznano za ślepą uliczkę ze względu na „lukę sim-to-real”. Jednak zarówno on, jak i Haarnoja, pracując w oddzielnych laboratoriach, pozostali przekonani, że można zamknąć tę lukę, czyniąc symulację bliższą rzeczywistości.
W Google DeepMind Haarnoja pracował nad projektem używającym wirtualnego uczenia ze wzmocnieniem do trenowania małych humanoidalnych robotów grających w piłkę nożną. W MIT Agrawal badał, jak trenować robotyczną rękę do chwytania przedmiotów od góry, nie tylko trzymania ich w dłoni.
Współzałożyciele Eka wierzą, że są w połowie drogi do rozwiązania problemu zręczności robotów. Ich zdaniem to już tylko kwestia skalowania obecnego podejścia, co mogłoby zrewolucjonizować wykorzystanie robotów nie tylko w fabrykach i magazynach, ale także w sklepach, restauracjach, a nawet gospodarstwach domowych.