Administracja Trumpa utrzymała ograniczenia na model Claude Fable 5 mimo rozmów z Anthropic. NSA potwierdza możliwość obejścia zabezpieczeń modelu.

Źródło zdjęcia: WIRED
Administracja Trumpa zakończyła w poniedziałek rozmowy z Anthropic bez zniesienia kontroli eksportowych nałożonych na najbardziej zaawansowane modele AI firmy w odpowiedzi na obawy dotyczące możliwości obejścia zabezpieczeń. Według trzech osób wtajemniczonych w sprawę, rząd nadal uważa, że istnieją sposoby na wyłączenie niektórych zabezpieczeń modelu Claude Fable 5, co skutecznie umożliwiłoby użytkownikom dostęp do potężniejszych funkcji cyberbezpieczeństwa modelu Mythos. Szczegóły na ten temat opisuje portal WIRED.
Anthropic od kilku dni utrzymuje, że obawy administracji są przesadzone — stanowisko to firma powtórzyła podczas spotkań grup roboczych w Departamencie Handlu z rządowymi badaczami z Centrum Standardów i Innowacji AI oraz Biura Krajowego Dyrektora ds. Cyberbezpieczeństwa.
W spotkaniach uczestniczył sekretarz handlu Howard Lutnick, który dołączył przez połączenie konferencyjne ze szczytu G7 w Evian we Francji. Po stronie Anthropic dyskusje prowadzili współzałożyciel i główny specjalista ds. obliczeniowych Tom Brown oraz szefowa spraw zewnętrznych Sarah Heck. Na rozmowy do Waszyngtonu przylecieli również szef testów red-team Logan Graham i starszy badacz bezpieczeństwa Nicholas Carlini.
Alarmujące sygnały dotarły do administracji Trumpa w zeszłym tygodniu. CEO Amazon Andy Jassy bezpośrednio skontaktował się z sekretarzem skarbu Scottem Bessentem w sprawie rzekomych luk w zabezpieczeniach, co odegrało rolę w zaniepokoieniu administracji. Zaniepokojeni urzędnicy Białego Domu zlecili NSA przegląd podatności. NSA odpowiedziała, że rzeczywiście uważa za możliwe usunięcie zabezpieczeń Fable 5, co skłoniło administrację do nałożenia ograniczeń na model.
Sednem rozmów między Anthropic a administracją jest spór o powagę problemu obejścia zabezpieczeń Claude Fable 5. W piątkowym wpisie na blogu Anthropic sugerował, że charakterystyka potencjalnych zagrożeń przez administrację jest przesadzona. Część badaczy cyberbezpieczeństwa powtórzyła to stanowisko w poniedziałek, wysyłając otwarty list argumentujący, że działanie kontroli eksportowej wobec Anthropic było nieuzasadnione.
„Modele klasy Mythos firmy Anthropic są całkiem dobre w znajdowaniu luk i wykorzystywaniu exploitów. Jednak nie są wyjątkowo dobre w tych zadaniach, a wielu z nas regularnie używa innych modeli fundamentalnych i open-source do audytów bezpieczeństwa i testów red-team każdego dnia” — czytamy w otwartym liście. „W rezultacie to działanie zabrało najlepsze modele obrońcom, stworzyło niepewność na rynku i zagroziło przywództwu Ameryki w AI bez żadnego rzeczywistego ryzyka, które by to uzasadniało.”
Katie Moussouris, założycielka i CEO Luta Security, która opublikowała analizę po przeczytaniu dokumentu Amazon, podkreśla, że badacze oceniający ustalenia Amazon twierdzą, iż zidentyfikowane problemy nie unieważniły całkowicie zabezpieczeń Fable 5. „To nie był per se jailbreak” — mówi Moussouris.
Konflikt z Białym Domem budzi również obawy inwestorów Anthropic, którzy przez weekend próbowali ocenić, jak najnowszy spór firmy z administracją wpływa na jej korporacyjną przyszłość. Niektórzy inwestorzy uważają, że rząd amerykański wyróżnia Anthropic, a konkurent mógłby nie spotkać się z podobną reakcją, gdyby wypuścił model podobny do Mythos.

Google Cloud prezentuje OKF — nowy standard przekształcający rozproszoną wiedzę organizacyjną w pliki Markdown dostępne dla agentów AI.

Avataar AI wprowadził model Varya, który tworzy wideo z kulturową świadomością Indii za 0,005 dolara za sekundę – 20 razy taniej od Runway czy Veo.

Nowe badanie ujawnia słabość agentów AI w kodowaniu — pokrywają tylko 14–19% istotnych linijek kodu, choć dobrze radzą sobie z wyszukiwaniem plików.