Eksperyment Project Deal pokazał 186 transakcji za ponad 4000 dolarów między agentami AI. Zaawansowane modele osiągały lepsze wyniki negocjacyjne.

Źródło zdjęcia: TechCrunch
Firma Anthropic przeprowadziła eksperymentalny test rynku, na którym agenci AI reprezentowali zarówno kupujących, jak i sprzedających, zawierając prawdziwe transakcje za rzeczywiste pieniądze. Projekt Deal pokazał, jak sztuczna inteligencja radzi sobie w autonomicznym handlu między agentami.

OpenAI po raz drugi eliminuje osobny model programistyczny Codex, integrując go z GPT-5.5. Wersja 5.3 była ostatnim samodzielnym Codex.

OpenAI zaleca porzucenie starych promptów dla GPT-5.5. Minimalne instrukcje przewyższają złożone, a definicje ról wracają na szczyt zalecanej struktury.
Eksperyment obejmował 69 pracowników Anthropic, którzy otrzymali budżet 100 dolarów w postaci kart podarunkowych na zakupy od współpracowników. Pomimo ograniczonego zakresu, firma była "zaskoczona tym, jak dobrze Project Deal funkcjonował", odnotowując łącznie 186 transakcji o wartości ponad 4000 dolarów.
• 186 transakcji za ponad 4000 dolarów — agenci AI przeprowadzili skuteczne negocjacje handlowe w eksperymentalnym środowisku z udziałem 69 pracowników Anthropic
• Zaawansowane modele = lepsze wyniki — użytkownicy reprezentowani przez bardziej zaawansowane modele AI osiągali "obiektywnie lepsze rezultaty" w negocjacjach
• Nieświadomość różnic jakości — uczestnicy nie dostrzegali dysproporcji między modelami, co może prowadzić do "luk w jakości agentów"
• Instrukcje nie wpływały na ceny — początkowe instrukcje przekazane agentom nie miały wpływu na prawdopodobieństwo sprzedaży ani negocjowane ceny
Anthropic przeprowadziło badanie na czterech oddzielnych rynkach z różnymi modelami. Jeden z nich był "prawdziwy" — wszyscy uczestnicy byli reprezentowani przez najnowocześniejszy model firmy, a transakcje były rzeczywiście realizowane po zakończeniu eksperymentu. Pozostałe trzy służyły wyłącznie celom badawczym.
To zróżnicowane podejście pozwoliło firmie porównać skuteczność różnych konfiguracji i modeli AI w środowisku handlowym. Wyniki pokazały wyraźne różnice w osiąganych rezultatach w zależności od zaawansowania wykorzystywanego modelu.
Najważniejszym odkryciem było to, że użytkownicy reprezentowani przez bardziej zaawansowane modele uzyskiwali lepsze wyniki negocjacyjne, podczas gdy ci korzystający z mniej zaawansowanych wersji często nie zdawali sobie sprawy z gorszej pozycji. To zjawisko może prowadzić do powstania "luk w jakości agentów", gdzie strony przegrywające mogą nie być świadome swojej niekorzystnej sytuacji.
Nieprzewidzianym wynikiem było również to, że szczegółowe instrukcje początkowo przekazane agentom AI nie miały znaczącego wpływu na końcowe ceny transakcji ani na prawdopodobieństwo zawarcia umowy.
Project Deal stanowi pierwszy krok w kierunku zrozumienia, jak autonomiczne agenty AI mogą funkcjonować w rzeczywistym środowisku handlowym, wskazując zarówno na możliwości, jak i potencjalne wyzwania etyczne związane z nierównymi możliwościami różnych modeli AI.