
Źródło zdjęcia: arXiv.org
Zespół naukowców z francuskich uniwersytetów opracował Fun-TSG — nowe narzędzie do generowania syntetycznych szeregów czasowych wielowymiarowych, które może znacząco usprawnić ocenę systemów wykrywania anomalii. Badanie zostało opublikowane na arXiv przez Pierre'a Lotte'a i współpracowników z EPE UT, IRIT oraz innych francuskich instytucji.
Aktualnie dostępne zestawy danych do testowania algorytmów wykrywania anomalii charakteryzują się istotnymi ograniczeniami — brakuje im szczegółowych adnotacji o anomaliach, nie zapewniają przejrzystych zależności między zmiennymi i w czasie, a także nie oferują wglądu w podstawowe mechanizmy generowania danych.
Jak wyjaśniają autorzy w abstracie, "wiarygodna ocena metod wykrywania anomalii w wielowymiarowych szeregach czasowych pozostaje otwartym wyzwaniem, głównie ze względu na ograniczenia istniejących zestawów danych benchmarkowych". Obecne zasoby często nie posiadają szczegółowych adnotacji anomalii, nie dostarczają wyraźnych zależności międzywariacyjnych i czasowych oraz oferują niewielki wgląd w podstawowe mechanizmy generowania.
Te braki utrudniają rozwój i rzetelne porównywanie modeli wykrywania, szczególnie tych ukierunkowanych na interpretowalne wyniki specyficzne dla zmiennych.
Fun-TSG został zaprojektowany jako w pełni konfigurowalne narzędzie do generowania szeregów czasowych, które wspiera wysokiej jakości ocenę systemów wykrywania anomalii. Narzędzie oferuje dwa główne tryby działania:
Generowanie automatyczne oparte na losowo próbkowanych strukturach zależności i typach anomalii, co pozwala na szybkie tworzenie zróżnicowanych zestawów testowych bez konieczności ręcznej konfiguracji.
Generowanie ręczne przez równania i konfiguracje anomalii zdefiniowane przez użytkownika, zapewniające pełną kontrolę nad procesem tworzenia danych testowych.
W obu przypadkach system zapewnia pełną przezroczystość procesu generowania danych, włączając dostęp do prawdziwych etykiet anomalii na poziomie zmiennych i znaczników czasowych.
Fun-TSG wypełnia istotną lukę w narzędziach badawczych, umożliwiając tworzenie zróżnicowanych, interpretowalnych i reprodukowalnych scenariuszy benchmarkowych. To z kolei pozwala na przeprowadzanie szczegółowej analizy wydajności zarówno dla klasycznych, jak i nowoczesnych modeli wykrywania anomalii.
Narzędzie może znacząco przyspieszyć rozwój bardziej precyzyjnych i niezawodnych systemów wykrywania anomalii, co ma kluczowe znaczenie dla zastosowań w monitoringu przemysłowym, cyberbezpieczeństwie czy analizie danych finansowych.