Badania i Nauka10 kwietnia 20265 min czytania

MIT przełamuje barierę energetyczną AI: Nowe transformery zużywają 90% mniej prądu

Naukowcy z MIT opracowali przełomową architekturę transformerów redukującą zużycie energii o 90% przy zachowaniu pełnej wydajności obliczeniowej.

MIT przełamuje barierę energetyczną AI: Nowe transformery zużywają 90% mniej prądu

Przełomowe badania prowadzone w Massachusetts Institute of Technology mogą zrewolucjonizować sposób działania sztucznej inteligencji. Naukowcy opracowali nową architekturę transformerów, która radykalnie obniża zużycie energii o 90%, nie poświęcając przy tym wydajności obliczeniowej.

Energetyczne wyzwanie współczesnej AI

Problem zużycia energii przez modele sztucznej inteligencji to jedna z najpoważniejszych barier w rozwoju tej technologii. Trening największych modeli językowych, takich jak GPT-4 czy PaLM, wymaga miesięcy pracy tysięcy procesorów graficznych, generując rachunki za prąd liczone w milionach dolarów. Według MIT Technology Review, szacuje się, że trening pojedynczego dużego modelu może zużyć tyle energii, co 300 gospodarstw domowych przez cały rok.

Tradycyjne transformery, będące podstawą współczesnych systemów AI, charakteryzują się kwadratową złożonością obliczeniową względem długości sekwencji wejściowej. Oznacza to, że podwojenie długości tekstu zwiększa czterokrotnie wymagania energetyczne — problem, który staje się szczególnie dotkliwy przy przetwarzaniu długich dokumentów czy prowadzeniu wielogodzinnych konwersacji.

Rewolucyjna architektura z MIT

Zespół badaczy pod kierunkiem profesor Han Song z MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) przedstawił innowacyjne podejście do projektowania transformerów. Kluczową innowacją jest wprowadzenie hierarchicznego mechanizmu uwagi, który selektywnie skupia moc obliczeniową tylko na najistotniejszych częściach przetwarzanych danych.

"Nasza architektura zmienia fundamentalne założenia dotyczące tego, jak transformery przetwarzają informacje. Zamiast analizować każdy token z równą intensywnością, skupiamy zasoby tam, gdzie są rzeczywiście potrzebne" — wyjaśnia główny autor badania, dr Liu Chen.

Nowa architektura wykorzystuje adaptacyjną modulację głębokości, która dynamicznie dostosowuje liczbę warstw przetwarzających w zależności od złożoności zadania. W praktyce oznacza to, że proste operacje mogą być wykonywane przez mniejszą liczbę warstw, podczas gdy złożone problemy automatycznie aktywują pełną moc obliczeniową modelu.

Kluczowe innowacje techniczne

Badacze zaimplementowali trzy główne optymalizacje:

1. Uwaga o rzadkiej strukturze (Sparse Attention Pattern)
System identyfikuje i skupia się wyłącznie na tokenach o wysokim znaczeniu kontekstowym, ignorując redundantne informacje. Algorytm wykorzystuje grafowe struktury danych do mapowania najważniejszych połączeń między elementami tekstu.

Podobne Publikacje

Badania i Nauka

Nowa metoda oceny agentów AI pozwala mierzyć błędy eksploracji i eksploatacji

Badacze opracowali sposób kwantyfikacji strategii podejmowania decyzji przez modele językowe bez dostępu do ich wewnętrznej architektury.

4 min16 kwietnia 2026

MIT przełamuje barierę energetyczną AI: Nowe transformery zużywają 90% mniej prądu

MIT przełamuje barierę energetyczną AI: Nowe transformery zużywają 90% mniej prądu

Energetyczne wyzwanie współczesnej AI

Rewolucyjna architektura z MIT

Kluczowe innowacje techniczne

Podobne Publikacje

Nowa metoda oceny agentów AI pozwala mierzyć błędy eksploracji i eksploatacji

Rezultaty testów i weryfikacja

Implikacje dla przemysłu i środowiska

Wyzwania implementacyjne

Przyszłość energooszczędnej AI

Źródła