OpenAI prezentuje GPT-5.6 z trzema modelami w cieniu regulacyjnego sporu z administracją Trumpa
OpenAI opóźnia wydanie GPT-5.6 na żądanie administracji Trumpa
Model AI programował przez 19 dni bez przerwy za 2600 dolarów w nowym benchmarku MirrorCode
Linux Foundation i 20 gigantów technologicznych uruchamia Akrites przeciwko atakom AI na kod open-source
Nowe podejście do testowania AI po nasyceniu benchmarków — studium CORE-Bench
Anthropic nie potrzebuje już młodszych inżynierów dzięki AI i ostrzega przed szokiem ekonomicznym
Anthropic uważa, że jej sukces jest kluczem do bezpiecznej AI
Ponad 2000 osób próbowało zhakować asystenta AI — wszystkie próby się nie powiodły
Nowa metoda wykrywa i kontroluje sykofancję w modelach AI za pomocą kaskadowych cech liniowych
Wydawcy 400 lokalnych gazet pozywają Microsoft i OpenAI za kradzież treści do trenowania AI
Ford przyznał się do błędu z AI i musiał zatrudnić z powrotem 350 inżynierów
Jakie tokeny lepiej przewidują modele hybrydowe? Badanie AllenAI porównuje Olmo Hybrid z transformerem
General Intuition pozyskało 2,3 mld dolarów na trenowanie AI przez gry wideo
Meta przywraca Facebook Creator Studio jako aplikację z asystentem AI
Mundial 2026: FIFA wprowadza AI dla wszystkich reprezentacji
Test Authors Guild: niektóre detektory AI idealnie rozpoznają ludzkie teksty, inne zawodzą przy każdym
OpenAI ulepsza GPT-5.5 Instant — model lepiej rozumie rzeczywiste intencje użytkowników
Jak wyłączyć wykorzystywanie danych do treningu AI w wyszukiwarce Google
Akcje Cerebras spadają o 20% mimo dobrych wyników — CEO wyjaśnia sprawę marż
Przewodnik po systemach agentowych AI: od fundamentów do wdrożeń produkcyjnych

OpenAI prezentuje GPT-5.6 z trzema modelami w cieniu regulacyjnego sporu z administracją Trumpa•
OpenAI opóźnia wydanie GPT-5.6 na żądanie administracji Trumpa•
Model AI programował przez 19 dni bez przerwy za 2600 dolarów w nowym benchmarku MirrorCode•
Linux Foundation i 20 gigantów technologicznych uruchamia Akrites przeciwko atakom AI na kod open-source•
Nowe podejście do testowania AI po nasyceniu benchmarków — studium CORE-Bench•
Anthropic nie potrzebuje już młodszych inżynierów dzięki AI i ostrzega przed szokiem ekonomicznym•
Anthropic uważa, że jej sukces jest kluczem do bezpiecznej AI•
Ponad 2000 osób próbowało zhakować asystenta AI — wszystkie próby się nie powiodły•
Nowa metoda wykrywa i kontroluje sykofancję w modelach AI za pomocą kaskadowych cech liniowych•
Wydawcy 400 lokalnych gazet pozywają Microsoft i OpenAI za kradzież treści do trenowania AI•
Ford przyznał się do błędu z AI i musiał zatrudnić z powrotem 350 inżynierów•
Jakie tokeny lepiej przewidują modele hybrydowe? Badanie AllenAI porównuje Olmo Hybrid z transformerem•
General Intuition pozyskało 2,3 mld dolarów na trenowanie AI przez gry wideo•
Meta przywraca Facebook Creator Studio jako aplikację z asystentem AI•
Mundial 2026: FIFA wprowadza AI dla wszystkich reprezentacji•
Test Authors Guild: niektóre detektory AI idealnie rozpoznają ludzkie teksty, inne zawodzą przy każdym•
OpenAI ulepsza GPT-5.5 Instant — model lepiej rozumie rzeczywiste intencje użytkowników•
Jak wyłączyć wykorzystywanie danych do treningu AI w wyszukiwarce Google•
Akcje Cerebras spadają o 20% mimo dobrych wyników — CEO wyjaśnia sprawę marż•
Przewodnik po systemach agentowych AI: od fundamentów do wdrożeń produkcyjnych•

Tag

#MirrorCode

1 artykuł z tym tagiem

Model AI programował przez 19 dni bez przerwy za 2600 dolarów w nowym benchmarku MirrorCode

Benchmark MirrorCode testuje zdolność modeli AI do odtwarzania programów od podstaw. Claude Opus 4.7 prowadzi z 56% skutecznością.

4 min26 czerwca