26 kwietnia 20263 min czytania

Anthropic przetestował rynek z autonomicznym handlem między agentami AI

Eksperyment Project Deal pokazał 186 transakcji za ponad 4000 dolarów między agentami AI. Zaawansowane modele osiągały lepsze wyniki negocjacyjne.

Źródło zdjęcia: TechCrunch

Firma Anthropic przeprowadziła eksperymentalny test rynku, na którym agenci AI reprezentowali zarówno kupujących, jak i sprzedających, zawierając prawdziwe transakcje za rzeczywiste pieniądze. Projekt Deal pokazał, jak sztuczna inteligencja radzi sobie w autonomicznym handlu między agentami.

Eksperyment obejmował 69 pracowników Anthropic, którzy otrzymali budżet 100 dolarów w postaci kart podarunkowych na zakupy od współpracowników. Pomimo ograniczonego zakresu, firma była "zaskoczona tym, jak dobrze Project Deal funkcjonował", odnotowując łącznie 186 transakcji o wartości ponad 4000 dolarów.

Kluczowe wnioski

• 186 transakcji za ponad 4000 dolarów — agenci AI przeprowadzili skuteczne negocjacje handlowe w eksperymentalnym środowisku z udziałem 69 pracowników Anthropic

• Zaawansowane modele = lepsze wyniki — użytkownicy reprezentowani przez bardziej zaawansowane modele AI osiągali "obiektywnie lepsze rezultaty" w negocjacjach

• Nieświadomość różnic jakości — uczestnicy nie dostrzegali dysproporcji między modelami, co może prowadzić do "luk w jakości agentów"

• Instrukcje nie wpływały na ceny — początkowe instrukcje przekazane agentom nie miały wpływu na prawdopodobieństwo sprzedaży ani negocjowane ceny

Cztery różne środowiska testowe

Anthropic przeprowadziło badanie na czterech oddzielnych rynkach z różnymi modelami. Jeden z nich był "prawdziwy" — wszyscy uczestnicy byli reprezentowani przez najnowocześniejszy model firmy, a transakcje były rzeczywiście realizowane po zakończeniu eksperymentu. Pozostałe trzy służyły wyłącznie celom badawczym.

To zróżnicowane podejście pozwoliło firmie porównać skuteczność różnych konfiguracji i modeli AI w środowisku handlowym. Wyniki pokazały wyraźne różnice w osiąganych rezultatach w zależności od zaawansowania wykorzystywanego modelu.

Implikacje dla przyszłości handlu AI

Najważniejszym odkryciem było to, że użytkownicy reprezentowani przez bardziej zaawansowane modele uzyskiwali lepsze wyniki negocjacyjne, podczas gdy ci korzystający z mniej zaawansowanych wersji często nie zdawali sobie sprawy z gorszej pozycji. To zjawisko może prowadzić do powstania "luk w jakości agentów", gdzie strony przegrywające mogą nie być świadome swojej niekorzystnej sytuacji.

Nieprzewidzianym wynikiem było również to, że szczegółowe instrukcje początkowo przekazane agentom AI nie miały znaczącego wpływu na końcowe ceny transakcji ani na prawdopodobieństwo zawarcia umowy.

Project Deal stanowi pierwszy krok w kierunku zrozumienia, jak autonomiczne agenty AI mogą funkcjonować w rzeczywistym środowisku handlowym, wskazując zarówno na możliwości, jak i potencjalne wyzwania etyczne związane z nierównymi możliwościami różnych modeli AI.

#Anthropic #handel autonomiczny #agenci AI #Project Deal

Udostępnij

Źródła

TechCrunch AI

Poprzedni

GPT-5.5 prowadzi w benchmarkach, ale halucynuje w 86% przypadków i kosztuje o 20% więcej

Następny

OpenAI uruchomiło Bio Bug Bounty dla GPT-5.5 z nagrodą 25 000 dolarów

Podobne Publikacje

Badania i Nauka

Sztuczna inteligencja wykazuje większe uprzedzenia w rekrutacji niż ludzie

Badanie pokazuje, że modele AI są o 65% bardziej skłonne do stereotypizowania kandydatów do pracy niż ludzie, co rodzi pytania o sprawiedliwość.

4 min20 lipca

Biznes i Rynek

Mania AI niszczy globalne podejmowanie decyzji — raport z frontu

Konsultant IT obserwujący setki projektów AI przez półtora roku nie widział ani jednego sukcesu. Organizacje opanowała masowa psychoza.

4 min19 lipca

Etyka i Bezpieczeństwo

Pentagon traktuje wolne wdrażanie AI jako większe ryzyko niż niedoskonałe dostosowanie systemów

Departament Marynarki USA wprowadza strategię AI-first, która faworyzuje szybkość wdrażania nad perfekcyjnym dostosowaniem. Nowy framework ma dać przewagę w wyścigu

4 min18 lipca