20 maja 20264 min czytania

Remove-AI-Watermarks — narzędzie do usuwania znaków wodnych z obrazów AI

Biblioteka i aplikacja konsolowa usuwa widoczne i niewidoczne watermarki z obrazów generowanych przez AI, w tym SynthID z Gemini i metadane C2PA.

Źródło zdjęcia: GitHub

Deweloper opublikował na platformie GitHub narzędzie Remove-AI-Watermarks — bibliotekę i aplikację konsolową służącą do usuwania zarówno widocznych, jak i niewidocznych znaków wodnych z obrazów generowanych przez sztuczną inteligencję. Narzędzie obsługuje obrazy z Google Gemini, ChatGPT/DALL-E, Stable Diffusion, Adobe Firefly, Midjourney i innych modeli AI. Projekt jest dostępny na GitHubie i oferuje także bezpłatną wersję webową.

Kluczowe wnioski

Narzędzie usuwa widoczne znaki wodne (logo Gemini), niewidoczne watermarki (SynthID, StableSignature, TreeRing) oraz metadane AI w jednej komendzie.
Wykorzystuje zaawansowane techniki: odwrotne mieszanie alfa dla widocznych znaków, regenerację dyfuzyjną dla niewidocznych watermarków i usuwanie metadanych C2PA/EXIF.
Oferuje funkcję „Smart Face Protection” automatycznie wykrywającą i chroniącą ludzkie twarze przed zniekształceniem podczas procesu czyszczenia.
Obsługuje przetwarzanie wsadowe całych katalogów oraz zawiera system detekcji watermarków z oceną pewności w trzech etapach.
Domyślnie używa pipeline'u SDXL od maja 2026 roku, który skutecznie radzi sobie z SynthID v2 z Gemini 3 Pro.

Jak działa usuwanie znaków wodnych

Widoczne watermarki Gemini

Google Gemini (wewnętrznie nazywany „Nano Banana”) dodaje widoczne logo w kształcie iskierek używając mieszania alfa według wzoru: watermarked = α × logo + (1 − α) × original. Narzędzie odwraca ten proces za pomocą znanej mapy alfa wyekstraktowanej z outputu Gemini na czarnym tle.

Trzyetapowy detektor NCC (Normalized Cross-Correlation) dynamicznie znajduje pozycję i skalę watermarku, co pozwala na działanie nawet gdy obraz został przeskalowany lub przycięty. Po usunięciu znak, pozostałe artefakty są czyszczone przez inpainting z maską gradientu. Proces zajmuje około 0,05 sekundy na obraz i nie wymaga GPU.

Niewidoczne watermarki SynthID

Google osadza SynthID w każdym obrazie generowanym przez Gemini. Inne serwisy używają StableSignature, TreeRing i podobnych schematów. Te niezauważalne wzory w domenie częstotliwości przetrwają kadrowanie, skalowanie i kompresję JPEG.

Pipeline usuwania (domyślny profil SDXL) działa następująco: obraz jest skalowany do ~1024px, kodowany do przestrzeni latentnej (VAE), poddawany kontrolowanemu szumowi (forward diffusion), odszumiany (reverse diffusion, ~50 kroków przy sile 0.05), dekodowany z powrotem do pikseli i przeskalowany do oryginalnej rozdzielczości.

Funkcje dodatkowe i obsługiwane modele

Narzędzie oferuje funkcję „Analog Humanizer” dodającą ziarno filmowe i aberrację chromatyczną, co sprawia, że output jest nie do odróżnienia od zdjęcia ekranu i oszukuje klasyfikatory obrazów AI. System „Smart Face Protection” używa YOLO do wykrywania ludzi w obrazie i wyodrębniania ich przed dyfuzją, a następnie miesza oryginalne twarze z powrotem używając miękkiej eliptycznej maski.

W zakresie metadanych, cleaner usuwa tagi EXIF (prompt, seed, hash modelu), XMP DigitalSourceType używany przez Instagram, Facebook i X do wyświetlania etykiet „Made with AI”, PNG text chunks z ComfyUI i AUTOMATIC1111 oraz manifesty C2PA Content Credentials z Google Imagen, OpenAI DALL-E i Adobe Firefly.

Narzędzie można zainstalować jako izolowaną aplikację CLI używając pipx lub uv, bez konieczności zarządzania wirtualnymi środowiskami. Podstawowa instalacja pokrywa usuwanie widocznych watermarków i metadanych, podczas gdy do usuwania niewidocznych znaków wodnych wymagane są dodatkowe zależności GPU.

#Gemini #obróbka obrazów #DALL-E #watermarki #SynthID

Udostępnij

Źródła

Hacker News AI

Poprzedni

System AI pomylił nazwiska absolwentów podczas rozdania dyplomów w college'u

Następny

Google Beam wprowadza nowe funkcje dla lepszych spotkań hybrydowych

Podobne Publikacje

Biznes i Rynek

Google DeepMind i A24 ogłaszają przełomowe partnerstwo badawcze w branży filmowej

Google DeepMind nawiązał pierwszą w swoim rodzaju współpracę ze studiem A24, aby wspólnie tworzyć narzędzia AI dla filmowców i rozszerzyć możliwości storytellingu.

3 min3 lipca

Biznes i Rynek

NVIDIA wprowadza nowy model biznesowy dla infrastruktury AI z współdzieleniem przychodów

NVIDIA umożliwia firmom AI dostęp do infrastruktury przez współdzielenie przychodów z chmurami. Sharon AI wdraża 40 tys. GPU, Firmus buduje kampus na 170 tys.

4 min2 lipca

Biznes i Rynek

AI zniszczyła rynek pracy dla młodych programistów

Zatrudnienie programistów 22–25 lat spadło o 19%, podczas gdy starsi developerzy zyskują. Dane Stanford pokazują, jak AI zmienia charakter pracy programisty.

4 min5 lipca

Kluczowe wnioski

Narzędzie usuwa widoczne znaki wodne (logo Gemini), niewidoczne watermarki (SynthID, StableSignature, TreeRing) oraz metadane AI w jednej komendzie.

Wykorzystuje zaawansowane techniki: odwrotne mieszanie alfa dla widocznych znaków, regenerację dyfuzyjną dla niewidocznych watermarków i usuwanie metadanych C2PA/EXIF.

Oferuje funkcję „Smart Face Protection” automatycznie wykrywającą i chroniącą ludzkie twarze przed zniekształceniem podczas procesu czyszczenia.

Obsługuje przetwarzanie wsadowe całych katalogów oraz zawiera system detekcji watermarków z oceną pewności w trzech etapach.

Domyślnie używa pipeline'u SDXL od maja 2026 roku, który skutecznie radzi sobie z SynthID v2 z Gemini 3 Pro.

Jak działa usuwanie znaków wodnych

Widoczne watermarki Gemini

Niewidoczne watermarki SynthID

Funkcje dodatkowe i obsługiwane modele