2 artykuły z tym tagiem
Naukowcy opracowali metodę LOCA, która identyfikuje przyczyny sukcesu ataków jailbreak. Wymaga tylko 6 zmian zamiast 20 jak poprzednie metody.
OpenAI zaprasza ekspertów do testowania GPT-5.5 pod kątem podatności na ataki biologiczne. Główna nagroda wynosi 25 000 dolarów za uniwersalny jailbreak.