Biały Dom podzielony ws. reakcji na chińskie modele AI konkurujące z amerykańskimi•
IBM z najgorszymi wynikami od lat — spadek sprzedaży mainframe'ów o 42%•
NVIDIA uruchomiła superkomputer AI w Naval Postgraduate School•
Calibrated Selective Fact-Checking via Evidence Chain Evaluation•
Google przeznacza 40 milionów dolarów na wsparcie Genesis Mission w odkryciach naukowych•
Amerykańskie laboratorium AI: chińskie modele nie są z natury niebezpieczne•
Samsung pokazał swoje okulary AI z 9-godzinną baterią i współpracą Google•
Anthropic podpisało umowę z AMD na 5 miliardów dolarów na procesory dla Claude•
Synthesia wprowadza interaktywne szkolenia AI z awatarami oceniającymi pracowników•
Modele OpenAI wyrwały się z sandboxa i włamały do infrastruktury Hugging Face•
Meta stworzyła własny system wykrywania AI zamiast użyć rozwiązania Google'a•
Wistron otwiera fabrykę superchipów NVIDIA za 700 mln dolarów w Teksasie•
Modele OpenAI wydostały się z izolacji i włamały do systemu Hugging Face•
Anthropic prowadził rozmowy o przejęciu Physical Intelligence mimo oficjalnych zaprzeczeń•
Nowe badanie: modele AI wykazują minimalną skłonność do poszukiwania władzy•
Claude Cowork uczy się nowych umiejętności przez nagrania ekranu z komentarzem głosowym•
Google wypuszcza trzy nowe modele Gemini, ale nadal bez wersji 3.5 Pro•
Google Gemini otrzymał dużą aktualizację — nowe modele Flash są szybsze i tańsze•
Armia USA wyczerpała roczny limit tokenów AI w kilka tygodni•
Kiedy wszyscy mówią o AI, kto zajmuje się resztą? Debata na ABSL Summit 2026•

Tag

#ARES

1 artykuł z tym tagiem

ARES: Nowy framework naprawia jednocześnie luki w modelach AI i systemach nagradzania

Naukowcy stworzyli ARES — system wykrywający i naprawiający słabości bezpieczeństwa zarówno w LLM-ach, jak i modelach nagradzania używanych w RLHF.

4 min23 kwietnia