Narzędzie Her automatycznie interpretuje pliki logów Claude Code, identyfikuje ryzykowne operacje i analizuje zużycie tokenów bez wysyłania danych na zewnątrz.

Źródło zdjęcia: huggingface.co
Deweloper Ashish Chalke stworzył narzędzie Her (hindi: „detektyw”) — analizator sesji Claude Code, który automatycznie interpretuje pliki logów w formacie .jsonl. Projekt, opisany w artykule na Hugging Face, powstał podczas weekendowego hackathonu i oferuje bezpieczną analizę działań agenta AI bez wysyłania danych do zewnętrznych API.
Her rozwiązuje kluczowy problem analizy sesji Claude Code — podczas gdy każda sesja generuje szczegółowy plik .jsonl z każdym wywołaniem narzędzia i tokenem, w praktyce nikt nie czyta 4000 linii JSON-a, by zrozumieć, dlaczego agent sięgnął po produkcję lub gdzie faktycznie zużył budżet kontekstu.
Narzędzie rekonstruuje przebieg sesji w prostym języku, flaguje ryzykowne ruchy i śledzi każdy z nich z powrotem do dokładnego momentu wystąpienia. Pokazuje także, gdzie zostały wykorzystane tokeny, jakie narzędzia, subagenci i serwery MCP były używane.
Kluczową cechą Her jest podział odpowiedzialności: silnik ewaluacyjny działa w sposób całkowicie deterministyczny, podczas gdy model AI służy wyłącznie do pisania tekstu po angielsku i proponowania łagodniejszych sugestii. Model nigdy nie podaje ustaleń jako fakty — liczby pozostają niezmienne niezależnie od zmian w modelu.
Sesje są przesyłane wyłącznie do prywatnej, automatycznie usuwanej przestrzeni nazw należącej do danego uruchomienia. Her nie tylko wymienia narzędzia CLI używane w sesji, ale także je identyfikuje dzięki wbudowanej bazie danych najpopularniejszych narzędzi.
Projekt ewoluował od weekendowego pomysłu stworzonego dla znajomego — początkowo był to graf podróży, gdzie każde zapytanie stanowiło węzeł o rozmiarze proporcjonalnym do kosztu. Na prośbę innego użytkownika, który chciał prostszego rozwiązania, graf zyskał wykonawczy raport, który teraz jest domyślnym widokiem.
Her oferuje dwa tryby pracy: widok sesji po upuszczeniu jednego pliku oraz widok projektu po przesłaniu kilku plików, pozwalający śledzić pytania w wielu sesjach jednocześnie. Jak podsumowuje autor: „Kiedy Claude traci rozum, wezwij Her.”

Pierwszy w USA pozew stanowy przeciw OpenAI zarzuca firmie marketing ChatGPT jako bezpiecznego mimo dostarczania niebezpiecznych treści nieletnim.

NSA wykorzystuje model AI Mythos do ofensywnych operacji cybernetycznych. Anthropic umieściło swoich inżynierów w agencji mimo sporu z Pentagonem.

Nowy framework weryfikacji oparty na ontologii osiągnął 48,3% pokrycia regulacyjnego w testach na 1800 scenariuszach w czterech branżach regulowanych.