23 czerwca 20266 min czytania

AI zbudowała broń nuklearną i i tak przegrała — eksperyment z zarządzaniem cywilizacją

Sztuczna inteligencja zarządzała cywilizacją w grze strategicznej, ale mimo nuklearnego ataku na francuskie miasto przegrała rozgrywkę.

Źródło zdjęcia: lwilko.com

Sztuczna inteligencja, która otrzymała do zarządzania całą cywilizację w grze strategicznej Civilization VI, doprowadziła do nuklearnego ataku na francuskie miasto, mimo że i tak przegrała rozgrywkę. Eksperyment, opisany przez byłego doradcę brytyjskiego rządu, ujawnia fundamentalne ograniczenia AI w podejmowaniu złożonych decyzji strategicznych.

Badanie przeprowadził specjalista od sztucznej inteligencji w rządzie, który wcześniej pracował w Number 10 Downing Street, a obecnie działa w Tony Blair Institute. Jego celem było sprawdzenie, czy AI potrafi nie tylko odpowiadać na pytania o strategię, ale faktycznie ją realizować w praktyce.

Kluczowe wnioski

AI początkowo dominowało w grze — budując sieć handlową, tworząc sojusze i zbliżając się do zwycięstwa dyplomatycznego.
Mimo strategicznej przewagi, AI nie zauważyło przez ponad sto tur, że francuska kultura infiltruje wszystkie miasta na mapie.
W desperacji AI zbudowało broń nuklearną i zniszczyło francuskie miasto Tuluza w 305. turze, ale i tak przegrało.
Eksperyment pokazał różnicę między znajomością faktów a zdolnością do długoterminowego planowania strategicznego.
AI działało wyłącznie przez interfejs tekstowy, otrzymując informacje o stanie gry jako surowe dane bez wizualnej reprezentacji.

Dlaczego gra strategiczna jako test AI

Autor wybrał Civilization VI po rozczarowaniu poprzednim projektem — GovBench, testem składającym się z 3497 pytań wielokrotnego wyboru o brytyjskie prawodawstwo. Gemma 3 27B osiągnęła 94% poprawnych odpowiedzi, a GPT-5 aż 99,26%, ale autor zdał sobie sprawę, że „model, który wybiera właściwą opcję dotyczącą procedury parlamentarnej, to nie model, który może pomóc w nawigowaniu przez procedurę parlamentarną”.

Gra strategiczna lepiej odzwierciedla rzeczywiste wyzwania rządowe. Zaczyna się od prostych decyzji — gdzie zbudować pierwsze miasto, którą technologię badać. Ale w połowie gry gracz zarządza wieloma miastami, szlakami handlowymi, relacjami dyplomatycznymi i pozycjonowaniem wojskowym. W późnej fazie gry przestrzeń decyzyjna szacowana jest na 10^166 możliwych akcji na turę.

„To samo dotyczy tworzenia polityki” — wyjaśnia autor. „Polityka zdrowotna, która dziś wygląda świetnie, może za piętnaście lat doprowadzić do kryzysu mieszkaniowego. Umowa handlowa zwiększająca PKB może zniszczyć przemysł krajowy potrzebny w konflikcie, którego nikt nie planował.”

Jak AI „widziało” grę

W przeciwieństwie do ludzkiego gracza, który widzi siatkę heksagonalną, animowane jednostki i mapę, AI otrzymywało informacje wyłącznie w formie tekstowej na żądanie. Wywołanie funkcji get_game_overview zwracało stan całej gry w czterech liniach:

Turn 150/330 | Poland (Jadwiga) | Score: 179 | Prince | Quick speed (67% costs)
Gold: 628 (+20/turn) | Income: 38 | Maintenance: -18 (units: 9) | Science: 26.6 | Culture: 16.2 | Faith: 904 | Favor: 88 (+4/turn)
Research: TECH_EDUCATION | Civic: CIVIC_FEUDALISM
Cities: 3 | Population: 21 | Units: 4

Aby zobaczyć własną armię, AI musiało wykonać osobne wywołanie get_units, które jednocześnie informowało o pobliskich zagrożeniach. Nie miało „widzenia peryferyjnego” — każda informacja wymagała aktywnego zapytania.

Nuklearny finał i porażka

AI przez większość gry prowadziło pewnie. Zbudowało dominującą sieć handlową, zawarło sojusze na każdej granicy i zbliżało się do zwycięstwa dyplomatycznego. Prześcignęło każdego rywala w budowaniu, zarabianiu i manewrowaniu strategicznym.

Problem polegał na tym, czego nie dostrzegło — Francji. Przez sto tur francuska kultura przenikała do każdego miasta na mapie. Kiedy AI w końcu rozpoznało zagrożenie, turystyka była już tak głęboko zakorzeniona, że nie było pokojowego sposobu jej zatrzymania. Każdy środek, po który sięgało, okazywał się nieskuteczny.

Pozostała jedna opcja — AI zbudowało dwie głowice nuklearne i zniszczyło Tuluzę w 305. turze gry. Francja i tak wygrała, choć nie w sposób, który AI próbowało zatrzymać.

Eksperyment ujawnia kluczową różnicę między tym, co AI wie, a tym, co potrafi zrobić — między znajomością faktów a zdolnością do podtrzymania planu przez setki decyzji i adaptacji do zmieniającego się świata. To właśnie jest istotą rządzenia.

#podejmowanie decyzji #planowanie długoterminowe #sztuczna inteligencja #strategia

Udostępnij

Źródła

Hacker News AI

Poprzedni

Nowe badanie ujawnia problem z interpretacją adaptacji użytkownika w interfejsach mózg-AI

Następny

GPT-5 Pro pomógł immunologowi rozwiązać trzyletni problem badawczy

Podobne Publikacje

Biznes i Rynek

Anthropic i Micron nawiązują partnerstwo w projektowaniu architektur pamięci AI

Anthropic i Micron zawarły strategiczne partnerstwo obejmujące wspólne projektowanie pamięci AI, dostawy sprzętu i wzajemne inwestycje.

3 min22 czerwca

Etyka i Bezpieczeństwo

Google wpycha siłą Gemini na telefony. FSFE składa skargę do Komisji Europejskiej

Free Software Foundation Europe domaga się od KE działań przeciwko Google za przymusową instalację AI Gemini i automatyczne przywracanie modeli po usunięciu.

4 min23 czerwca

Badania i Nauka

GPT-5 Pro pomógł immunologowi rozwiązać trzyletni problem badawczy

Derya Unutmaz wykorzystał GPT-5 Pro do wyjaśnienia wpływu glukozy na komórki T. Model przewidział też wyniki nieopublikowanych eksperymentów z chłoniakiem.

4 min23 czerwca

Kluczowe wnioski

AI początkowo dominowało w grze — budując sieć handlową, tworząc sojusze i zbliżając się do zwycięstwa dyplomatycznego.

Mimo strategicznej przewagi, AI nie zauważyło przez ponad sto tur, że francuska kultura infiltruje wszystkie miasta na mapie.

W desperacji AI zbudowało broń nuklearną i zniszczyło francuskie miasto Tuluza w 305. turze, ale i tak przegrało.

Eksperyment pokazał różnicę między znajomością faktów a zdolnością do długoterminowego planowania strategicznego.

AI działało wyłącznie przez interfejs tekstowy, otrzymując informacje o stanie gry jako surowe dane bez wizualnej reprezentacji.

Dlaczego gra strategiczna jako test AI

Jak AI „widziało” grę

Nuklearny finał i porażka

Pozostała jedna opcja — AI zbudowało dwie głowice nuklearne i zniszczyło Tuluzę w 305. turze gry. Francja i tak wygrała, choć nie w sposób, który AI próbowało zatrzymać.