2 artykuły z tym tagiem
Nowy benchmark IBM testuje agentów AI w środowisku z 8000+ API, pokazując znaczące luki w wieloetapowym rozumowaniu biznesowym.
Anthropic zgłasza podwyższoną liczbę błędów w Claude.ai, API i Claude Code. Dostępność systemu spadła do 92,89% w ciągu ostatniego tygodnia.