OpenAI zaprezentowało GPT-5.5-Cyber, który osiąga 85,6% w benchmarku CyberGym, przewyższając konkurencyjny Mythos 5. Nowy model automatyzuje proces od wykrycia luk do łatek.

Źródło zdjęcia: The Decoder
OpenAI rozszerza swoją inicjatywę cyberbezpieczeństwa Daybreak o nowe narzędzia, które nie tylko identyfikują luki w zabezpieczeniach, ale także automatycznie je naprawiają. Firma zaprezentowała zaktualizowaną wtyczkę Codex Security oraz pełną wersję modelu GPT-5.5-Cyber, który według oficjalnych danych przewyższa konkurencyjny model Mythos firmy Anthropic na benchmarkach cyberbezpieczeństwa.
Aktualizacja jest odpowiedzią na problem, który OpenAI identyfikuje jako główne wąskie gardło w cyberbezpieczeństwie — przejście od wykrywania luk do ich faktycznego łatania. Firma uruchomiła również program partnerski z ponad 25 firmami zabezpieczającymi i kilkoma rządami.
Wtyczka Codex Security, która zadebiutowała jako podgląd badawczy w marcu, przeszła znaczącą aktualizację. Od momentu premiery przeskanowała ponad 30 milionów commitów w ponad 30 000 bazach kodu. System automatycznie oznaczył ponad 500 000 problemów jako naprawione, a recenzenci ręcznie potwierdzili kolejne 70 000.
OpenAI projektuje zaktualizowaną wtyczkę jako „inżyniera bezpieczeństwa siedzącego obok każdego developera”. Narzędzie analizuje kod wraz z modelem zagrożeń, wykrywa luki, sprawdza czy podatny kod jest rzeczywiście dostępny, buduje ukierunkowaną łatkę i weryfikuje rezultat.
Nowości w tej aktualizacji obejmują głębokie skanowanie całych baz kodu, analizę ścieżek ataku oraz eksport do istniejących systemów zarządzania lukami poprzez pliki SARIF lub zapytania CodeQL. Wtyczka może także segregować wyniki z innych skanerów lub raportów bug bounty oraz automatyzować generowanie łatek w trybie wsadowym.
Pełna wersja GPT-5.5-Cyber zastępuje wcześniejszy podgląd, który głównie miał na celu zmniejszenie niepotrzebnych odmów w procesach bezpieczeństwa. OpenAI nazywa zaktualizowany model najbardziej wydajnym pojedynczym modelem do znajdowania i łatania luk w oprogramowaniu.
Model prowadzi we wszystkich kluczowych benchmarkach cyberbezpieczeństwa. W CyberGym, który mierzy czy agent może odtworzyć znane luki w środowiskach programowych, GPT-5.5-Cyber osiąga 85,6%, podczas gdy Mythos 5 uzyskuje 83,8%. W ExploitGym, testującym zdolność przekształcania luk w działające exploity, model osiąga 39,5%. W SEC-bench Pro, oceniającym długoterminowe wykrywanie luk, GPT-5.5-Cyber uzyskuje 69,8%.
Najnowsza wersja GPT-5.5-Cyber jest celowo bardziej permisywna niż standardowe modele i odmawia mniej żądań. Jednak tylko zweryfikowani obrońcy mogą uzyskać do niego dostęp, a OpenAI łączy ten dostęp z weryfikacją, monitoringiem i zabezpieczeniami.
Poprzez Daybreak Cyber Partner Program firmy zabezpieczające mogą zintegrować GPT-5.5 z Trusted Access for Cyber ze swoimi produktami. Partnerzy obejmują Cisco, CrowdStrike, Cloudflare, Palo Alto Networks, IBM, Fortinet, Wiz, SentinelOne, Darktrace, Palantir, Accenture, PwC i KPMG.
OpenAI rozszerza również pracę z rządami. Firma ma partnerstwa Trusted Access z Australią, Kanadą, Francją, Niemcami, Japonią, Koreą Południową, agencją UE ENISA oraz Wielką Brytanią. W USA OpenAI pracuje nad realizacją niedawno wydanego rozporządzenia wykonawczego dotyczącego bezpieczeństwa AI i planuje bezpośrednią współpracę z operatorami infrastruktury krytycznej.
Inicjatywa „Patch the Planet”, realizowana wspólnie z Trail of Bits, HackerOne i Calif, ma na celu przeniesienie tych samych narzędzi łatania na oprogramowanie open-source. Ponad 30 projektów open-source przyłączyło się do inicjatywy, w tym cURL, Go, Python, Sigstore i pyca/cryptography. Pierwszy pięciodniowy sprint wykazał setki problemów i doprowadził do dziesiątek scalonych łatek.

Anthropic i OpenAI wydały łącznie 27 mln dolarów walcząc o wpływ na regulacje AI w kongresowych prawyborach. Alex Bores przegrał nieznacznie z Lasher.

AI pozwala cyberprzestępcom tworzyć bardziej wiarygodne oszustwa przed największymi Mistrzostwami Świata w historii. Zarejestrowano już ponad 13 000 podejrzan

GPT-5.5 Instant w ChatGPT otrzymał aktualizację poprawiającą zrozumienie celów użytkowników i jakość odpowiedzi w lokalnych zapytaniach biznesowych.