8 maja 20264 min czytania

CyberSecQwen-4B: dlaczego cyberbezpieczeństwo potrzebuje małych, wyspecjalizowanych modeli lokalnych

Nowy model AI o 4 mld parametrów dla cyberbezpieczeństwa działa lokalnie i osiąga 97% dokładności 8-miliardowego konkurenta przy połowie rozmiaru.

Źródło zdjęcia: huggingface.co

Zespół badaczy zaprezentował CyberSecQwen-4B — wyspecjalizowany model AI o rozmiarze 4 miliardów parametrów, przeznaczony dla cyberbezpieczeństwa obronnego. Model został wytrenowany na jednym procesorze graficznym AMD Instinct MI300X i ma działać lokalnie, bez konieczności wysyłania wrażliwych danych do zewnętrznych serwerów. Szczegóły projektu opisano w artykule na Hugging Face.

Kluczowe wnioski

CyberSecQwen-4B osiąga 97,3% dokładności 8-miliardowego modelu Foundation-Sec-Instruct-8B przy połowie jego rozmiaru, jednocześnie przewyższając go o 8,7 punktu procentowego w testach CTI-MCQ.
Model można uruchomić na jednej karcie graficznej z 12 GB pamięci, co czyni go dostępnym dla środowisk z ograniczonymi zasobami sprzętowymi.
Został wytrenowany na danych Apache-2.0, w tym mapowaniach CVE→CWE z MITRE/NVD oraz syntetycznych danych Q&A dla analityków bezpieczeństwa.
Całkowity proces treningu odbywał się na jednym AMD Instinct MI300X z 192 GB pamięci HBM3, bez konieczności kwantyzacji czy dzielenia modelu między urządzenia.
Model adresuje kluczowy problem bezpieczeństwa — konieczność przetwarzania wrażliwych danych cyberbezpieczeństwa lokalnie, bez wysyłania do zewnętrznych API.

Dlaczego lokalne modele są kluczowe dla cyberbezpieczeństwa

Autorzy projektu argumentują, że duże modele generatywne, choć uniwersalne, mają istotne ograniczenia w zastosowaniach obronnych. Wysyłanie wrażliwych danych — jak raporty incydentów, payloady ataków czy szkice ujawnień podatności — do zewnętrznych API może samo w sobie stanowić naruszenie bezpieczeństwa.

Koszty API również stanowią barierę. Średniej wielkości centrum operacji bezpieczeństwa (SOC) przetwarza tysiące alertów o niskim poziomie pewności dziennie. Automatyzacja zadań takich jak „wyjaśnij tę podatność CVE” czy „jakie CWE tutaj stosuje” może szybko stać się problemem budżetowym przy użyciu hostowanych modeli.

Dodatkowo, środowiska typu air-gap oraz częściowo połączone sieci są standardem w infrastrukturze krytycznej, służbie zdrowia i instytucjach rządowych. Jeśli narzędzie nie może działać na laptopie lub pojedynczej karcie graficznej, nie zostanie tam wdrożone.

Metodologia i wyniki testów

Model wykorzystuje jako bazę Qwen3–4B-Instruct-2507 — najlepiej działający model 4B dostępny w czasie treningu, z licencją Apache-2.0. Kluczową decyzją było fine-tunowanie od wersji instruction-tuned, a nie bazowej, co pozwoliło zachować odpowiedni format odpowiedzi dla zadań wielokrotnego wyboru.

W testach porównawczych na benchmarku CTI-Bench, CyberSecQwen-4B osiągnął:

CTI-MCQ (2500 pozycji): 0,5868 ± 0,0029 vs 0,4996 dla Foundation-Sec-Instruct-8B
CTI-RCM (1000 pozycji CVE→CWE): 0,6664 ± 0,0023 vs 0,6850 dla konkurenta

Model wykorzystuje konfigurację LoRA z r=64, alpha=64, learning rate 5e-5 oraz FlashAttention-2 dla optymalizacji pamięci i prędkości. Cały proces — trening, łączenie adapterów i ewaluacja — odbywa się na jednym AMD Instinct MI300X z 192 GB pamięci HBM3.

Dane treningowe składają się z dwóch zbiorów: mapowań CVE→CWE z lat 2021 z publicznych rekordów MITRE/NVD oraz syntetycznych danych Q&A generowanych przez silniejszy model nauczyciel. Kluczowo, wszystkie przecięcia z zestawem ewaluacyjnym CTI-Bench zostały usunięte przed treningiem, zapewniając rzetelne wyniki testów.

CyberSecQwen-4B pokazuje, że wyspecjalizowane modele o mniejszych rozmiarach mogą skutecznie konkurować z większymi odpowiednikami w wąskich domenach, jednocześnie oferując praktyczne korzyści w postaci lokalnego wdrażania i kontroli nad wrażliwymi danymi.

#fine-tuning #modele lokalne #cyberbezpieczeństwo #CTI-Bench #AMD

Udostępnij

Źródła

Hugging Face Blog

Poprzedni

OpenAI udostępnia GPT-5.5-Cyber specjalistom od cyberbezpieczeństwa

Następny

PlayStation sees AI as a ‘powerful tool’ to help make games

Podobne Publikacje

Poradniki

Jak wyłączyć wykorzystywanie danych do treningu AI w wyszukiwarce Google

Google automatycznie włącza funkcję wykorzystującą zdjęcia i nagrania użytkowników do treningu AI. Wyjaśniamy, jak się z tego wypisać.

4 min25 czerwca

Narzędzia i Aplikacje

CEO Pangram: modele językowe zdradzają się powtarzalnością argumentów

Max Spero ujawnia, że AI generuje argumenty w wąskim paśmie, podczas gdy ludzkie myślenie charakteryzuje się większą różnorodnością.

3 min24 czerwca

Biznes i Rynek

NVIDIA i AWS rozszerzają współpracę w zakresie infrastruktury AI na skalę produkcyjną

NVIDIA i AWS wprowadzają nowe instancje EC2 G7 z GPU Blackwell oraz przyspieszenie wektorowe w OpenSearch dla łatwiejszego wdrażania AI.

4 min24 czerwca

Kluczowe wnioski

CyberSecQwen-4B osiąga 97,3% dokładności 8-miliardowego modelu Foundation-Sec-Instruct-8B przy połowie jego rozmiaru, jednocześnie przewyższając go o 8,7 punktu procentowego w testach CTI-MCQ.

Model można uruchomić na jednej karcie graficznej z 12 GB pamięci, co czyni go dostępnym dla środowisk z ograniczonymi zasobami sprzętowymi.

Został wytrenowany na danych Apache-2.0, w tym mapowaniach CVE→CWE z MITRE/NVD oraz syntetycznych danych Q&A dla analityków bezpieczeństwa.

Całkowity proces treningu odbywał się na jednym AMD Instinct MI300X z 192 GB pamięci HBM3, bez konieczności kwantyzacji czy dzielenia modelu między urządzenia.

Model adresuje kluczowy problem bezpieczeństwa — konieczność przetwarzania wrażliwych danych cyberbezpieczeństwa lokalnie, bez wysyłania do zewnętrznych API.

Dlaczego lokalne modele są kluczowe dla cyberbezpieczeństwa

Metodologia i wyniki testów

W testach porównawczych na benchmarku CTI-Bench, CyberSecQwen-4B osiągnął:

CTI-MCQ (2500 pozycji): 0,5868 ± 0,0029 vs 0,4996 dla Foundation-Sec-Instruct-8B

CTI-RCM (1000 pozycji CVE→CWE): 0,6664 ± 0,0023 vs 0,6850 dla konkurenta