22 czerwca 20264 min czytania

Dostrojenie lokalnego modelu Qwen 3:0.6B do kategoryzacji pytań przynosi dobre rezultaty

Eksperyment z modelem o 600M parametrów pokazuje, jak małe LLM można przekształcić w skuteczny klasyfikator pytań domowych.

Źródło zdjęcia: teachmecoolstuff.com

Deweloper Torgeir Helgevold przeprowadził eksperyment z dostrojeniem lokalnego modelu językowego Qwen 3:0.6B do kategoryzacji pytań domowych. Wyniki pokazują, jak mały model z zaledwie 600 milionami parametrów może zostać przekształcony w skuteczny klasyfikator po odpowiednim treningu. Szczegóły badania opisuje w swoim artykule na blogu.

Projekt miał na celu stworzenie chatbota odpowiadającego na pytania domowe za pomocą systemu RAG (Retrieval-Augmented Generation). Kluczowym elementem była kategoryzacja pytań przed przeszukiwaniem bazy wektorowej, co miało zawęzić przestrzeń wyszukiwania tylko do odpowiednich metadanych.

Kluczowe wnioski

Model bazowy Qwen 3:0.6B bez dostrojenia osiągnął jedynie 10% dokładności (13 poprawnych odpowiedzi z 131 testów) w kategoryzacji pytań domowych.
Po dostrojeniu za pomocą frameworka Unsloth na zbiorze około 850 przykładów model znacząco poprawił swoją skuteczność.
Główne problemy modelu bazowego to nadużywanie szerokich kategorii jak „electric” czy „appliances” oraz wymyślanie nowych kategorii spoza dozwolonej listy.
Eksperyment wykorzystywał podział danych 70/15/15 na zbiory treningowy, walidacyjny i testowy.
Autor stosował strategię QLora w połączeniu z domyślnymi parametrami Unsloth jako punkt startowy do dostrajania.

Architektura systemu i metodologia

Helgevold wykorzystywał dwa różne modele Qwen 3 w swoim projekcie. Większy model 4B parametrów służył do odpowiadania na pytania, podczas gdy mniejszy 0.6B był dedykowany wyłącznie do klasyfikacji. Taki podział miał na celu przetestowanie hipotezy, czy tak mały model może zostać skutecznie wyspecjalizowany w konkretnym zadaniu.

Zbiór danych treningowych składał się z pytań domowych przypisanych do 18 kategorii, takich jak „pool”, „car”, „hvac”, „cooking”, „gutters” czy „water heater”. Przykładowe pytania obejmowały: „Kto czyści nasze rynny?” (kategoria: gutters) czy „Jakie są wymiary filtrów powietrza do domowej klimatyzacji?” (kategoria: hvac).

Do dostrajania autor zastosował framework Unsloth z metodą QLora. Jak podkreśla, domyślne parametry Unsloth stanowią dobry punkt wyjścia, a kluczowe jest przygotowanie odpowiednich danych treningowych.

Wyniki i wnioski

Test bazowy ujawnił poważne ograniczenia niewystrojonego modelu. Model nie tylko osiągał bardzo niską dokładność, ale też wykazywał charakterystyczne wzorce błędów. Nadmiernie często przypisywał pytania do szerokich kategorii i nie trzymał się listy dozwolonych kategorii, co pokazują przykłady z raportu testowego.

W jednym przypadku pytanie „Kiedy wymieniliśmy dolny system klimatyzacji?” zostało błędnie zakategoryzowane jako „electric” zamiast poprawnego „hvac”. W innym przypadku model zwrócił kategorię „apartments”, której w ogóle nie było na liście dozwolonych opcji.

Eksperyment potwierdził, że bardzo małe modele językowe mogą być skutecznie wyspecjalizowane w konkretnych zadaniach klasyfikacji, pod warunkiem odpowiedniego dostrojenia na reprezentatywnym zbiorze danych.

#fine-tuning #lokalne modele #Qwen #klasyfikacja #Unsloth

Udostępnij

Źródła

Hacker News AI

Poprzedni

100 tysięcy powodów: jak rozpoznać treści generowane przez AI

Następny

Przewodnik po systemach agentowych AI: od fundamentów do wdrożeń produkcyjnych

Podobne Publikacje

Modele AI

GPT-5.5-Cyber przewyższa model Mythos w cyberbezpieczeństwie

OpenAI zaprezentowało GPT-5.5-Cyber, który osiąga 85,6% w benchmarku CyberGym, przewyższając konkurencyjny Mythos 5. Nowy model automatyzuje proces od wykrycia luk do łatek.

4 min23 czerwca

Narzędzia i Aplikacje

Apple przedstawia praktyczne funkcje AI w iOS 27 — poza odświeżoną Siri

iOS 27 wprowadza funkcje AI zintegrowane z istniejącymi aplikacjami: dzielenie rachunków, aktualizowanie haseł i inteligentne sugestie w Wiadomościach.

4 min21 czerwca

Etyka i Bezpieczeństwo

Oszustwa na Mundialu 2026 stają się trudniejsze do wykrycia dzięki AI

AI pozwala cyberprzestępcom tworzyć bardziej wiarygodne oszustwa przed największymi Mistrzostwami Świata w historii. Zarejestrowano już ponad 13 000 podejrzan

4 min22 czerwca