21 czerwca 20263 min czytania

The Atlantic ujawnił bazę danych muzyki używanej do trenowania AI

Reporter odkrył cztery zbiory z dziesiątkami milionów utworów, w tym piosenki Lady Gagi, Radiohead i Wu-Tang Clan używane do trenowania modeli AI.

Źródło zdjęcia: The Verge

The Atlantic stworzył przeszukiwalną bazę danych muzyki używanej do trenowania AI, ujawniając miliony utworów dostępnych w zestawach treningowych. Reporter Alex Reisner odkrył cztery zbiory danych muzycznych i udostępnił je publicznie w ramach portalu AI Watchdog.

Dwa z odkrytych zestawów są ogromne — zawierają odpowiednio 12 milionów i 9 milionów utworów. Pozostałe dwa są mniejsze, ale wciąż znaczące, z ponad 100 000 piosenek każdy. Te zbiory zostały pobrane tysiące razy, a firmy takie jak Google i Stability potwierdziły ich wykorzystanie w swoich pracach badawczych.

Kluczowe wnioski

The Atlantic ujawnił cztery zbiory danych muzycznych używanych do trenowania AI, zawierające łącznie dziesiątki milionów utworów.
Największe zestawy obejmują 12 milionów i 9 milionów utworów, pobieranych tysiące razy przez różnych deweloperów AI.
W bazach znajdują się utwory znanych artystów jak Lady Gaga, Radiohead, Aphex Twin, Wu-Tang Clan czy Bruce Springsteen.
Trzy z czterech zbiorów są dystrybuowane jako listy linków do YouTube i Spotify, wymagające specjalnych narzędzi do pobierania.
Używanie tych narzędzi narusza regulaminy platform streamingowych, omijając mechanizmy zarabiania przez twórców.

Jak działają zbiory treningowe

Większość odkrytych zbiorów nie zawiera bezpośrednio plików audio. Jak wyjaśnia Reisner, trzy z czterech zestawów są dystrybuowane jako listy linków do utworów na YouTube lub Spotify. Deweloperzy AI muszą następnie pobrać rzeczywistą muzykę przy użyciu zautomatyzowanych narzędzi.

Te narzędzia pozwalają omijać logowania, reklamy i mechanizmy, które mogłyby generować przychody dla twórców lub platformy. Takie praktyki naruszają regulaminy serwisów streamingowych, tworząc prawną szarą strefę wokół wykorzystania muzyki do celów treningowych.

Niektóre źródła, jak Free Music Archive dataset, są dostępne za darmo do użytku osobistego, ale wymagają licencjonowania do zastosowań komercyjnych.

Znane nazwiska w bazach danych

Przeszukiwalna baza The Atlantic ujawnia obecność utworów wielu znanych artystów w zbiorach treningowych AI. W zestawieniu pojawiają się nazwiska gwiazd popu jak Lady Gaga i Fred Again.., kultowych zespołów jak Radiohead i Wu-Tang Clan, legendy rock'a Bruce Springsteen, elektroniczny wizjoner Aphex Twin, a także eksperymentalny kompozytor Hainbach.

Portal AI Watchdog umożliwia użytkownikom samodzielne przeszukiwanie nie tylko muzyki, ale także książek i innych mediów wykorzystywanych do trenowania światowych modeli AI. To pierwszy tego typu publiczny dostęp do informacji o źródłach danych treningowych.

Ujawnienie The Atlantic rzuca światło na powszechną praktykę wykorzystywania chronionych prawem autorskim utworów do trenowania systemów AI, często bez wiedzy lub zgody twórców. Dostępność przeszukiwalnej bazy danych może przyczynić się do szerszej debaty o prawach autorskich w erze sztucznej inteligencji.

#muzyka AI #dane treningowe #prawa autorskie #The Atlantic #YouTube

Udostępnij

Źródła

The Verge AI

Poprzedni

Prezeska Signal ostrzega: chatboty AI to nie są wasi przyjaciele

Następny

Oszustwa na Mundialu 2026 stają się trudniejsze do wykrycia dzięki AI

Podobne Publikacje

Badania i Nauka

GPT-5 Pro pomógł immunologowi rozwiązać trzyletni problem badawczy

Derya Unutmaz wykorzystał GPT-5 Pro do wyjaśnienia wpływu glukozy na komórki T. Model przewidział też wyniki nieopublikowanych eksperymentów z chłoniakiem.

4 min23 czerwca

Biznes i Rynek

Ford przyznał się do błędu z AI i musiał zatrudnić z powrotem 350 inżynierów

Ford wygrał ranking jakości, ale przyznał, że zbyt mocno uwierzył w AI. Firma zatrudniła 350 doświadczonych inżynierów, by naprawić błędy algorytmów.

4 min25 czerwca

Narzędzia i Aplikacje

Apple przedstawia praktyczne funkcje AI w iOS 27 — poza odświeżoną Siri

iOS 27 wprowadza funkcje AI zintegrowane z istniejącymi aplikacjami: dzielenie rachunków, aktualizowanie haseł i inteligentne sugestie w Wiadomościach.

4 min21 czerwca