Nowy model MAI-Image-2.5 zajmuje trzecie miejsce na Arena's text-to-image leaderboard, wprowadzając usprawnienia w renderowaniu tekstu i wizualizacjach.

Źródło zdjęcia: The Decoder
Microsoft wypuścił aktualizację swojego modelu MAI-Image-2.5, który zajmuje trzecie miejsce na liście Arena's text-to-image leaderboard i dorównuje poziomem Google'owi Nano Banana 2. Szczegółowy przegląd nowej wersji znajduje się w raporcie The Decoder.
Według zespołu MAI, nowy model dorównuje Google Nano Banana 2, choć nadal ustępuje OpenAI Image-2. Microsoft określa MAI-Image-2.5 jako najmocniejszy model graficzny w swojej ofercie, wprowadzając znaczące ulepszenia w kilku kluczowych obszarach.
Microsoft podkreśla znaczące postępy MAI-Image-2.5 w porównaniu do MAI-Image-2. Nowa wersja excels w trzech głównych obszarach: renderowaniu tekstu, tworzeniu stylizowanych ilustracji oraz generowaniu wizualizacji komercyjnych.
Według danych z rankingu Arena, MAI-Image-2.5 wyraźnie przewyższa swoich poprzedników we wszystkich ośmiu kategoriach. Szczególnie widoczne usprawnienia dotyczą renderowania tekstu, portretów oraz motywów komercyjnych. Model lepiej interpretuje polecenia użytkowników, co przekłada się na bardziej precyzyjne rezultaty.
Microsoft kieruje MAI-Image-2.5 przede wszystkim do profesjonalnych zastosowań. Firma wskazuje na fotografie produktowe i projektowanie marki jako kluczowe obszary wykorzystania nowego modelu. Usprawnienia w zakresie spójności oświetlenia, głębi i relacji przestrzennych mają szczególne znaczenie dla tego typu aplikacji komercyjnych.
Model jest już dostępny na platformie Arena. Microsoft zapowiada, że w ciągu najbliższych dwóch tygodni MAI-Image-2.5 trafi również do MAI Playground i Foundry, rozszerzając dostępność dla szerszego grona użytkowników.
MAI-Image-2.5 stanowi kolejny krok w rywalizacji między największymi graczami na rynku generatywnej AI, choć OpenAI Image-2 nadal utrzymuje pozycję lidera w tej kategorii.
Programista opisuje, jak AI stało się dla niego 'termojądrowym wzmacniaczem ADHD', prowadząc do tworzenia 50 niepotrzebnych projektów bez zaangażowania.

Amazon dodaje funkcję generowania obrazów produktów przez AI w wyszukiwarce mobilnej. Użytkownicy mogą opisać odzież słowami i znaleźć podobne dostępne przedmioty.

Dziennikarz The Verge odkrył prawdę o Gudtrip — vaporizer obiecuje bitcoiny za palenie, ale firma przyznaje, że nagrody są wypłacane jednorazowo.