Pionier AI argumentuje, że systemy oparte na uczeniu nadzorowanym mogą być nowatorskie lub dobre, ale nigdy obie cechy jednocześnie.

Źródło zdjęcia: X (formerly Twitter)
Richard Sutton, jeden z pionierów sztucznej inteligencji i uczenia ze wzmocnieniem, przedstawił kontrowersyjną tezę dotyczącą ograniczeń współczesnej generatywnej AI. W swoim przemówieniu, opublikowanym na platformie X, badacz z University of Alberta argumentuje, że systemy oparte na uczeniu nadzorowanym nie są zdolne do prawdziwych odkryć naukowych.
Sutton odnosi się do znanego żartu akademickiego: „Ta praca jest zarówno nowatorska, jak i dobra. Niestety, części, które są dobre, nie są nowatorskie, a części, które są nowatorskie, nie są dobre.” Według niego, ten opis idealnie pasuje do dużej części dzisiejszej AI.
Sutton wyjaśnia, że współczesne modele językowe i generatory obrazów działają na zasadzie naśladowania przykładów z danych treningowych. Gdy system generuje odpowiedź wysokiej jakości, czerpie ją z materiału źródłowego — nie jest więc nowatorska. Gdy produkuje coś nowatorskiego, oznacza to odstępstwo od danych treningowych, co często prowadzi do „halucynacji” i niskiej jakości.
„W wielu przypadkach to w ogóle nie jest problem” — zaznacza Sutton. Gdy pytamy AI o fakty lub podsumowanie dokumentu, nie chcemy nowatorskich odpowiedzi. Jakość powinna pochodzić z materiału źródłowego, nie z „kreatywności” systemu. Problem pojawia się, gdy oczekujemy prawdziwej kreatywności.
Nawet w przypadku fikcji i rozrywki trudno ocenić rzeczywistą kreatywność AI, ponieważ nie znamy wszystkich źródeł, z których system może czerpać. Proces generowania jest częściowo stochastyczny — każda decyzja może pójść w różnych kierunkach, ale trajektoria jest albo losowa (nowatorska), albo oparta na danych treningowych (dobra).
Sutton wskazuje na systemy AI, które wykraczają poza zwykłe naśladowanie i dokonują prawdziwych odkryć. AlphaGo zaskoczyło świat ruchem 37, który uznano za rewolucyjny w strategii gry w go. AlphaZero rozwinęło oryginalny styl gry w szachy. GT-Sophy prowadzi symulowane samochody wyścigowe lepiej niż ludzie. AlphaFold i AlphaProof przyniosły rzeczywiste postępy w nauce i matematyce.
Wszystkie te systemy łączy jedna cecha: posiadają dodatkowe elementy wykraczające poza uczenie nadzorowane. Sutton nazywa to „Discovery” — prostą koncepcję próbowania wielu rozwiązań i wybierania tych, które działają najlepiej. To podstawa ewolucji przez selekcję naturalną, metody naukowej i zwykłego uczenia się.
„To, co mogłoby być bardziej oczywiste? W tym przypadku behawioralnym psychologia ma dwie nazwy...” — w tym miejscu przemówienie zostaje przerwane, ale główna myśl jest jasna: prawdziwa kreatywność wymaga mechanizmu eksperymentowania i selekcji, którego brakuje zwykłej generatywnej AI.
Według Suttona, dla zastosowań naukowych i matematycznych potrzebne są systemy AI wykraczające poza naśladowanie. Generatywna AI może być transformacyjną technologią w wielu dziedzinach, ale ma fundamentalne ograniczenia, które uniemożliwiają jej dokonywanie prawdziwych odkryć.

OpenAI rezygnuje z planów autonomicznego AI do 2028 roku, postulując współpracę człowieka z maszyną i międzynarodową kontrolę rozwoju technologii.

Claude Fable 5, pierwsza publiczna wersja zaawansowanego Mythos, dostępna z surowymi limitami w obszarach wysokiego ryzyka i ceną 50 USD za milion tokenów.

OpenAI planuje w najbliższych tygodniach wprowadzić odnowioną wersję ChatGPT jako super aplikację z narzędziami programistycznymi i agentami AI.