3 maja 20264 min czytania

Chińskie modele AI tracą dystans do USA według raportu amerykańskiej agencji

CAISI twierdzi, że Deepseek V4 Pro jest o 8 miesięcy za GPT-5, ale niezależne pomiary pokazują stały dystans między krajami.

Źródło zdjęcia: The Decoder

Poprzedni

Microsoft caught sneaking "Co-Authored-by Copilot" into VS Code commits - even with AI off

Następny

Xiaomi MiMo-V2.5-Pro pisze kompilator w 4,3 godziny i konkuruje z Claude Opus

Podobne Publikacje

Poradniki

Naucz się budować własny model językowy od podstaw w jednej sesji

Nowy warsztat pozwala wytrenować funkcjonalny GPT na laptopie w mniej niż godzinę, budując każdy komponent od zera bez gotowych bibliotek.

4 min5 maja

Biznes i Rynek

Brockman broni 30-miliardowego udziału w OpenAI: „krew, pot i łzy”

Współzałożyciel OpenAI stanął przed sądem w sprawie Muska, broniąc majątku wartego nawet 30 miliardów dolarów i odpierając zarzuty o „moralną niewypłacalność”.

Kluczowe wnioski

Deepseek V4 Pro osiąga poziom GPT-5 — według CAISI chiński model dorównuje wydanemu osiem miesięcy wcześniej GPT-5, nie zaś aktualnym modelom jak Opus 4.6 czy GPT-5.4.

Największe różnice w rozumowaniu abstrakcyjnym — model radzi sobie gorzej w cyberbezpieczeństwie, programowaniu i myśleniu abstrakcyjnym, jedynie matematyka jest na poziomie zbliżonym do topowych modeli.

Przewaga cenowa Chińczyków — Deepseek V4 okazał się tańszy od porównywalnego GPT-5.4 mini w pięciu z siedmiu testów.

Niezależne pomiary pokazują stały dystans — dane z Artificial Analysis Intelligence Index sugerują, że luka między USA a Chinami pozostaje względnie stała, nie rośnie.

Kontrowersyjne wyniki amerykańskiej agencji

CAISI, które funkcjonuje w ramach Narodowego Instytutu Standardów i Technologii (NIST), nazywa Deepseek V4 Pro „najbardziej zaawansowanym chińskim modelem AI do tej pory”. Jednak w prywatnych testach model miał osiągać gorsze wyniki niż sugeruje to raport techniczny samego Deepseek.

Podczas gdy Deepseek prezentuje swój model jako równorzędny z aktualnymi amerykańskimi rozwiązaniami jak Opus 4.6 i GPT-5.4, CAISI twierdzi, że faktycznie znajduje się na poziomie starszego GPT-5. Szczególnie widoczne różnice dotyczą rozumowania abstrakcyjnego, cyberbezpieczeństwa i rozwoju oprogramowania. Matematyka to jedyny obszar, w którym Deepseek V4 niemal dorównuje najlepszym amerykańskim modelom.

Cena vs możliwości — nowy paradygmat

Rosnące znaczenie może mieć aspekt ekonomiczny. Deepseek V4 Pro okazał się tańszy od porównywalnego GPT-5.4 mini w większości testów, co nabiera znaczenia w miarę jak modele AI mają obsługiwać coraz dłuższe i bardziej złożone zadania. Tymczasem najlepsze amerykańskie modele stają się coraz droższe.

Kwestia ta jest istotna, ponieważ firmy nie dysponują jeszcze wiarygodnymi metodami pomiaru zwrotu z inwestycji w AI, szczególnie uwzględniając efekty wtórne jak szkolenia, podnoszenie kwalifikacji czy kontrola błędów. Po przekroczeniu pewnego progu możliwości, wydajność „wystarczająco dobra” przy niskiej cenie może okazać się bardziej atrakcyjna niż najwyższa wydajność w premium cenach.

Przykład stanowi Cursor, konkurent Claude Code, który podobno zostanie przejęty przez SpaceX. Firma zbudowała swój dostosowany model kodowania w oparciu o chiński model open-weight, co czyni go znacznie tańszym od oferty OpenAI czy Anthropic.

CEO OpenAI Sam Altman wydaje się podzielony w tej kwestii. W niedawnym poście na X napisał: „Ciągle myślę, że chcę, żeby modele były tańsze/szybsze bardziej niż mądrzejsze, ale wydaje się, że po prostu bycie mądrzejszym to nadal najważniejsza rzecz.”

Stanowisko Altmana może opierać się na założeniu, że inteligentniejsza AI mogłaby pomóc w ulepszaniu samej siebie, przyspieszając postęp we wszystkich obszarach. OpenAI, Anthropic i chińscy deweloperzy wszyscy niedawno stwierdzili, że ich własne modele już przyspieszają ich prace badawczo-rozwojowe.

Raport CAISI, mimo swojego prawdopodobnie politycznego charakteru, pokazuje złożoność oceny postępów w wyścigu sztucznej inteligencji między superpaństwami. Podczas gdy możliwości techniczne pozostają istotne, czynniki ekonomiczne mogą odegrać równie ważną rolę w kształtowaniu przyszłości branży AI.