Gemini 3.5 Flash otrzymał wbudowaną funkcję computer use, umożliwiając tworzenie agentów AI zdolnych do interakcji z różnymi platformami i aplikacjami.

Źródło zdjęcia: Google
Google wprowadza funkcję kontroli komputera bezpośrednio do modelu Gemini 3.5 Flash, umożliwiając tworzenie agentów AI zdolnych do interakcji z różnymi platformami. Wcześniej dostępna jedynie jako osobny model Gemini 2.5, funkcjonalność computer use została teraz zintegrowana natywnie z głównym modelem Flash.
Nowa implementacja pozwala deweloperom budować niestandardowych agentów, którzy potrafią widzieć, rozumować i podejmować działania w środowiskach przeglądarkowych, mobilnych i desktopowych. To znaczący krok w rozwoju autonomicznych systemów AI zdolnych do wykonywania złożonych zadań automatyzacyjnych.
Gemini 3.5 Flash z funkcją computer use otwiera nowe możliwości dla automatyzacji procesów biznesowych. Model potrafi analizować interfejsy użytkownika, jak pokazano w przykładzie z audytem dokumentacji pod kątem dostępności czy kategoryzacją funkcji aplikacji Gemini.
Szczególną wartość rozwiązanie ma dla przedsiębiorstw prowadzących długoterminowe procesy automatyzacji, ciągłe testowanie oprogramowania oraz pracę z wieloma aplikacjami biznesowymi. Dzięki natywnej integracji z modelem Flash, deweloperzy zyskują dostęp do zaawansowanych możliwości rozumowania i podejmowania działań bez konieczności używania osobnych modeli specjalistycznych.
Google wprowadził szereg mechanizmów bezpieczeństwa w odpowiedzi na potencjalne zagrożenia związane z agentami działającymi w rzeczywistych środowiskach. Firma zastosowała ukierunkowane szkolenie adversarialne, aby zmniejszyć ryzyko ataków prompt injection.
Dodatkowo dostępne są dwa opcjonalne systemy zabezpieczeń dla przedsiębiorstw: wymaganie jawnej zgody użytkownika na działania wrażliwe lub nieodwracalne oraz automatyczne zatrzymywanie zadań w przypadku wykrycia pośredniego ataku prompt injection. Google zaleca podejście „defense-in-depth”, łączące te funkcje z bezpiecznym środowiskiem testowym, weryfikacją przez człowieka i ścisłą kontrolą dostępu.
Deweloperzy mogą już dziś rozpocząć pracę z nową funkcjonalnością przez demonstracyjne środowisko hostowane przez Browserbase lub bezpośrednio przez dokumentację i implementację referencyjną dostępną w Gemini API.

SpaceX wynajmie Reflection AI chipy Nvidia GB300 za 150 mln dolarów miesięcznie. Startup otwartych modeli AI konkuruje z Anthropic i OpenAI.

OpenAI zaprezentowało GPT-5.5-Cyber, który osiąga 85,6% w benchmarku CyberGym, przewyższając konkurencyjny Mythos 5. Nowy model automatyzuje proces od wykrycia luk do łatek.

OpenAI musi najpierw udostępnić nowe modele AI wybranym klientom zatwierdzonym przez rząd amerykański, zanim będą dostępne publicznie.