Nowy model AI do kodowania od Cursor osiąga wydajność najlepszych modeli za mniej niż dolara za zadanie, podczas gdy konkurencja kosztuje do 11 USD.

Źródło zdjęcia: The Decoder
Cursor zaprezentował Composer 2.5, nową wersję swojego modelu AI do kodowania, która w testach wydajności dorównuje najnowszym modelom Anthropic i OpenAI, oferując przy tym znacznie niższe koszty. Szczegóły aktualizacji przedstawiono w dokumentacji na The Decoder.
Nowy model został zbudowany na bazie otwartego checkpointa Kimi K2.5 od Moonshot i przeszedł szkolenie na 25-krotnie większej liczbie syntetycznych zadań niż jego poprzednik Composer 2. Firma przeznacczyła 85 procent budżetu obliczeniowego na dodatkowe szkolenie i uczenie ze wzmocnieniem.
Composer 2.5 osiąga porównywalną wydajność z najnowszymi modelami konkurencji przy znacznie niższych kosztach. Podczas gdy zadanie w Composer 2.5 kosztuje mniej niż dolara, konkurencyjna oferta może sięgać nawet jedenastu dolarów za zadanie. Ta różnica cenowa może mieć istotne znaczenie dla deweloperów i firm intensywnie korzystających z narzędzi AI do kodowania.
Szybsza wersja modelu, chociaż droższa od podstawowej, nadal pozostaje konkurencyjna cenowo w porównaniu z ofertą Anthropic i OpenAI, oferując przy tym identyczną wydajność.
Cursor nie poprzestaje na obecnym sukcesie i już pracuje nad znacznie większym następcą modelu. Nowy projekt realizowany jest we współpracy z SpaceX i xAI, wykorzystując dziesięciokrotnie większą moc obliczeniową klastra Colossus-2 z milionem jednostek równoważnych H100.
Warto przypomnieć, że SpaceX wcześniej ogłosiło plany przejęcia Cursor za 60 miliardów dolarów, co wskazuje na strategiczne znaczenie tej technologii dla przyszłych projektów firmy Elona Muska.
Composer 2.5 pokazuje, że efektywne wykorzystanie zasobów obliczeniowych i przemyślana strategia szkolenia mogą prowadzić do modeli równie wydajnych jak te od liderów rynku, ale oferowanych w znacznie bardziej przystępnych cenach.

Nowy Gemini 3.5 Flash osiąga 280 tokenów na sekundę, ale koszty wzrosły trzykrotnie. W zadaniach agentowych przewyższa nawet droższy model Pro.

Qwen3.7-Max osiągnął 10-krotne przyspieszenie kodu, przewyższając konkurencyjne modele w 35-godzinnym autonomicznym eksperymencie optymalizacji.

Chris Lehane, były doradca Białego Domu, ma przekonać świat do technologii OpenAI i kształtować korzystne regulacje w obliczu rosnącego sceptycyzmu.