4 artykuły z tym tagiem
Badacze opracowali sposób kwantyfikacji strategii podejmowania decyzji przez modele językowe bez dostępu do ich wewnętrznej architektury.
OpenAI wprowadza nowe funkcjonalności do SDK agentów, w tym piaskownicę i harness dla modeli frontier, mające zwiększyć bezpieczeństwo i możliwości automatyzacji.
Nowy benchmark IBM testuje agentów AI w środowisku z 8000+ API, pokazując znaczące luki w wieloetapowym rozumowaniu biznesowym.
Nowe rozwiązanie AI Protect umożliwia cofanie działań autonomicznych agentów sztucznej inteligencji w środowiskach chmurowych przedsiębiorstw.