Biblioteka i aplikacja konsolowa usuwa widoczne i niewidoczne watermarki z obrazów generowanych przez AI, w tym SynthID z Gemini i metadane C2PA.
Źródło zdjęcia: GitHub
Deweloper opublikował na platformie GitHub narzędzie Remove-AI-Watermarks — bibliotekę i aplikację konsolową służącą do usuwania zarówno widocznych, jak i niewidocznych znaków wodnych z obrazów generowanych przez sztuczną inteligencję. Narzędzie obsługuje obrazy z Google Gemini, ChatGPT/DALL-E, Stable Diffusion, Adobe Firefly, Midjourney i innych modeli AI. Projekt jest dostępny na GitHubie i oferuje także bezpłatną wersję webową.
Google Gemini (wewnętrznie nazywany „Nano Banana”) dodaje widoczne logo w kształcie iskierek używając mieszania alfa według wzoru: watermarked = α × logo + (1 − α) × original. Narzędzie odwraca ten proces za pomocą znanej mapy alfa wyekstraktowanej z outputu Gemini na czarnym tle.
Trzyetapowy detektor NCC (Normalized Cross-Correlation) dynamicznie znajduje pozycję i skalę watermarku, co pozwala na działanie nawet gdy obraz został przeskalowany lub przycięty. Po usunięciu znak, pozostałe artefakty są czyszczone przez inpainting z maską gradientu. Proces zajmuje około 0,05 sekundy na obraz i nie wymaga GPU.
Google osadza SynthID w każdym obrazie generowanym przez Gemini. Inne serwisy używają StableSignature, TreeRing i podobnych schematów. Te niezauważalne wzory w domenie częstotliwości przetrwają kadrowanie, skalowanie i kompresję JPEG.
Pipeline usuwania (domyślny profil SDXL) działa następująco: obraz jest skalowany do ~1024px, kodowany do przestrzeni latentnej (VAE), poddawany kontrolowanemu szumowi (forward diffusion), odszumiany (reverse diffusion, ~50 kroków przy sile 0.05), dekodowany z powrotem do pikseli i przeskalowany do oryginalnej rozdzielczości.
Narzędzie oferuje funkcję „Analog Humanizer” dodającą ziarno filmowe i aberrację chromatyczną, co sprawia, że output jest nie do odróżnienia od zdjęcia ekranu i oszukuje klasyfikatory obrazów AI. System „Smart Face Protection” używa YOLO do wykrywania ludzi w obrazie i wyodrębniania ich przed dyfuzją, a następnie miesza oryginalne twarze z powrotem używając miękkiej eliptycznej maski.
W zakresie metadanych, cleaner usuwa tagi EXIF (prompt, seed, hash modelu), XMP DigitalSourceType używany przez Instagram, Facebook i X do wyświetlania etykiet „Made with AI”, PNG text chunks z ComfyUI i AUTOMATIC1111 oraz manifesty C2PA Content Credentials z Google Imagen, OpenAI DALL-E i Adobe Firefly.
Narzędzie można zainstalować jako izolowaną aplikację CLI używając pipx lub uv, bez konieczności zarządzania wirtualnymi środowiskami. Podstawowa instalacja pokrywa usuwanie widocznych watermarków i metadanych, podczas gdy do usuwania niewidocznych znaków wodnych wymagane są dodatkowe zależności GPU.

Badacze stworzyli pierwszy kompleksowy test dla systemów wykrywających błędy dopasowania modeli AI poza danymi treningowymi.

Chiński Deepseek przekształca promocję w stałą strategię cenową. Model V4 Pro kosztuje 0,87$ za milion tokenów wyjściowych wobec 30$ u GPT-5.5.
OpenAI ogłasza rozszerzenie programu Education for Countries o Singapur, dzieląc się wynikami z pierwszej grupy krajów wdrażających AI w edukacji.