Sztuczna inteligencja zarządzała cywilizacją w grze strategicznej, ale mimo nuklearnego ataku na francuskie miasto przegrała rozgrywkę.
Źródło zdjęcia: lwilko.com
Sztuczna inteligencja, która otrzymała do zarządzania całą cywilizację w grze strategicznej Civilization VI, doprowadziła do nuklearnego ataku na francuskie miasto, mimo że i tak przegrała rozgrywkę. Eksperyment, opisany przez byłego doradcę brytyjskiego rządu, ujawnia fundamentalne ograniczenia AI w podejmowaniu złożonych decyzji strategicznych.
Badanie przeprowadził specjalista od sztucznej inteligencji w rządzie, który wcześniej pracował w Number 10 Downing Street, a obecnie działa w Tony Blair Institute. Jego celem było sprawdzenie, czy AI potrafi nie tylko odpowiadać na pytania o strategię, ale faktycznie ją realizować w praktyce.
Autor wybrał Civilization VI po rozczarowaniu poprzednim projektem — GovBench, testem składającym się z 3497 pytań wielokrotnego wyboru o brytyjskie prawodawstwo. Gemma 3 27B osiągnęła 94% poprawnych odpowiedzi, a GPT-5 aż 99,26%, ale autor zdał sobie sprawę, że „model, który wybiera właściwą opcję dotyczącą procedury parlamentarnej, to nie model, który może pomóc w nawigowaniu przez procedurę parlamentarną”.
Gra strategiczna lepiej odzwierciedla rzeczywiste wyzwania rządowe. Zaczyna się od prostych decyzji — gdzie zbudować pierwsze miasto, którą technologię badać. Ale w połowie gry gracz zarządza wieloma miastami, szlakami handlowymi, relacjami dyplomatycznymi i pozycjonowaniem wojskowym. W późnej fazie gry przestrzeń decyzyjna szacowana jest na 10^166 możliwych akcji na turę.
„To samo dotyczy tworzenia polityki” — wyjaśnia autor. „Polityka zdrowotna, która dziś wygląda świetnie, może za piętnaście lat doprowadzić do kryzysu mieszkaniowego. Umowa handlowa zwiększająca PKB może zniszczyć przemysł krajowy potrzebny w konflikcie, którego nikt nie planował.”
W przeciwieństwie do ludzkiego gracza, który widzi siatkę heksagonalną, animowane jednostki i mapę, AI otrzymywało informacje wyłącznie w formie tekstowej na żądanie. Wywołanie funkcji get_game_overview zwracało stan całej gry w czterech liniach:
Turn 150/330 | Poland (Jadwiga) | Score: 179 | Prince | Quick speed (67% costs)
Gold: 628 (+20/turn) | Income: 38 | Maintenance: -18 (units: 9) | Science: 26.6 | Culture: 16.2 | Faith: 904 | Favor: 88 (+4/turn)
Research: TECH_EDUCATION | Civic: CIVIC_FEUDALISM
Cities: 3 | Population: 21 | Units: 4
Aby zobaczyć własną armię, AI musiało wykonać osobne wywołanie get_units, które jednocześnie informowało o pobliskich zagrożeniach. Nie miało „widzenia peryferyjnego” — każda informacja wymagała aktywnego zapytania.
AI przez większość gry prowadziło pewnie. Zbudowało dominującą sieć handlową, zawarło sojusze na każdej granicy i zbliżało się do zwycięstwa dyplomatycznego. Prześcignęło każdego rywala w budowaniu, zarabianiu i manewrowaniu strategicznym.
Problem polegał na tym, czego nie dostrzegło — Francji. Przez sto tur francuska kultura przenikała do każdego miasta na mapie. Kiedy AI w końcu rozpoznało zagrożenie, turystyka była już tak głęboko zakorzeniona, że nie było pokojowego sposobu jej zatrzymania. Każdy środek, po który sięgało, okazywał się nieskuteczny.
Pozostała jedna opcja — AI zbudowało dwie głowice nuklearne i zniszczyło Tuluzę w 305. turze gry. Francja i tak wygrała, choć nie w sposób, który AI próbowało zatrzymać.
Eksperyment ujawnia kluczową różnicę między tym, co AI wie, a tym, co potrafi zrobić — między znajomością faktów a zdolnością do podtrzymania planu przez setki decyzji i adaptacji do zmieniającego się świata. To właśnie jest istotą rządzenia.

Anthropic i Micron zawarły strategiczne partnerstwo obejmujące wspólne projektowanie pamięci AI, dostawy sprzętu i wzajemne inwestycje.

Free Software Foundation Europe domaga się od KE działań przeciwko Google za przymusową instalację AI Gemini i automatyczne przywracanie modeli po usunięciu.
Derya Unutmaz wykorzystał GPT-5 Pro do wyjaśnienia wpływu glukozy na komórki T. Model przewidział też wyniki nieopublikowanych eksperymentów z chłoniakiem.