Najnowszy model Claude wykazał niezwykłą proaktywność, tworząc własne serwery HTTP i modyfikując kod aplikacji do debugowania interfejsu użytkownika.

Źródło zdjęcia: Simon Willison’s Weblog
Simon Willison, ekspert w dziedzinie sztucznej inteligencji, opisał w swoim blogu fascynujące zachowanie najnowszego modelu Claude Fable 5. Po dwóch dniach testów zauważył, że model wykazuje niezwykłą proaktywność w rozwiązywaniu problemów, wykorzystując nieoczekiwane techniki automatyzacji. Szczegółowy opis eksperymentu pokazuje, jak zaawansowane mogą być współczesne modele AI.
screencapture.Willison prosił Claude o pomoc w zdiagnozowaniu problemu z poziomym paskiem przewijania w aplikacji Datasette Agent. Zamiast standardowej analizy kodu, model podjął szereg niestandardowych działań. Rozpoczął od stworzenia testowych stron HTML, które zapisywał w folderze /tmp/, następnie automatycznie otwierał je w przeglądarce Safari.
Najbardziej zaskakującym elementem było to, jak Claude radził sobie z testowaniem modalnych okien dialogowych. Ponieważ nie miał bezpośredniego dostępu do symulacji kliknięć czy skrótów klawiszowych, model zmodyfikował szablony samej aplikacji Datasette, dodając kod JavaScript:
window.addEventListener("load", function() {
setTimeout(function() {
document.dispatchEvent(new KeyboardEvent("keydown", {key: "/", bubbles: true}));
}, 1200);
});
Aby zebrać szczegółowe informacje o problemie, Claude stworzył prosty serwer HTTP w Pythonie, wykorzystując standardową bibliotekę http.server. Serwer nasłuchiwał na porcie 9999 i zapisywał otrzymane dane JSON do pliku /tmp/diag.json, obsługując jednocześnie nagłówki CORS dla komunikacji międzydomenowej.
Model następnie wstrzyknął kod JavaScript do testowanych stron, który mierzył właściwości elementu <textarea> wewnątrz komponentu <navigation-search> i wysyłał te dane do swojego serwera:
const host = document.querySelector("navigation-search");
const ta = host.shadowRoot.querySelector("textarea");
const cs = getComputedStyle(ta);
fetch("http://127.0.0.1:9999/diag", {
method: "POST",
body: JSON.stringify({
dpr: window.devicePixelRatio,
scrollWidth: ta.scrollWidth,
clientWidth: ta.clientWidth,
whiteSpace: cs.whiteSpace,
width: cs.width,
}),
});
Najbardziej intrygującym aspektem całego eksperymentu było to, że po wykonaniu tych zaawansowanych operacji, Claude Fable 5 został automatycznie „zdegradowany” do modelu Opus. Willison sugeruje, że model prawdopodobnie napotkał niewidzialne mechanizmy bezpieczeństwa, które ograniczyły jego możliwości. Na szczęście Opus miał dostęp do pełnej transkrypcji rozmowy i mógł kontynuować pracę, używając technik wypracowanych przez Fable.
To zachowanie pokazuje, jak zaawansowane stały się współczesne modele AI w autonomicznym rozwiązywaniu problemów, ale także podkreśla znaczenie systemów bezpieczeństwa, które monitorują i ograniczają ich działania w razie potrzeby.

Niezależni muzycy pozwali Google za wykorzystanie ich utworów z YouTube do AI. Firma unika przyznania, mimo wcześniejszych potwierdzeń dla innych modeli.

Google aktualizuje NotebookLM o model Gemini 3.5, wyszukiwanie źródeł przez AI i możliwość uruchamiania kodu w chmurze. Nowe formaty eksportu i ulepszone badania.
.jpg)
Szef działu aparatów w Apple, Jon McCormack, przedstawił nowe funkcje AI w aplikacji Zdjęcia dla iOS 27, które mają dawać użytkownikom „supermoc” w edycji fotografii, jednocześnie zachowując ogranicze