Avataar AI wprowadził model Varya, który tworzy wideo z kulturową świadomością Indii za 0,005 dolara za sekundę – 20 razy taniej od Runway czy Veo.

Źródło zdjęcia: TechCrunch
Indyjski startup Avataar AI wprowadził nowy model generowania wideo o nazwie Varya, który został zaprojektowany z myślą o lokalnym kontekście kulturowym i znacznie niższych kosztach działania. Model jest efektem rządowej inicjatywy India AI Mission wartej 1,2 miliarda dolarów, która ma na celu rozwój sztucznej inteligencji w kraju. Informacje pochodzą z TechCrunch.
Avataar AI, wspierany przez fundusz Peak XV i specjalizujący się w narzędziach wideo dla e-commerce, nie stworzył modelu od podstaw. Zamiast tego wykorzystał publicznie dostępny model Wan 2.2 od Alibaba, stosując technikę destylacji, która pozwoliła skompresować możliwości modelu do szybszej i bardziej efektywnej wersji.
Największą zaletą Varya jest drastyczna redukcja kosztów i czasu generowania. Podczas gdy oryginalny model Wan 2.2 potrzebuje 50 kroków do wygenerowania wideo, Varya działa w zaledwie 4 krokach. To przekłada się na 10-krotne przyspieszenie procesu przy jednoczesnym znacznym obniżeniu kosztów.
Jak tłumaczy Rajan Anandan, dyrektor zarządzający Peak XV: „Indie to rynek, w którym wideo jest na pierwszym miejscu. Widzimy to w każdym dużym produkcie internetowym w Indiach: wideo wygrywa z tekstem. Obecne modele AI do generowania wideo są zbyt drogie do użytku na skalę populacyjną w Indiach”.
Avataar AI przyznaje, że standardowe modele generowania obrazów i wideo często pomijają niuanse kulturowe, produkując stereotypowe lub ogólnikowe rezultaty. Varya została wytrenowana na wyselekcjonowanych danych, aby lepiej rozpoznawać elementy kultury indyjskiej, w tym lokalne jedzenie, tradycyjne ubrania, architekturę i festiwale.
Model będzie udostępniony na indyjskim portalu AI Kosh jako open-weight wraz z danymi treningowymi, co oznacza, że deweloperzy będą mogli go hostować samodzielnie lub modyfikować zgodnie z własnymi potrzebami. Avataar planuje również udostępnić model swoim klientom korporacyjnym i jest otwarty na partnerstwa z narzędziami wideo takimi jak Higgsfield i Adobe Firefly.
Wprowadzenie Varya odzwierciedla fundamentalny kompromis w ambicjach AI Indii. Weterani branży zauważają, że Indie mogą zaznaczyć swoją obecność w sztucznej inteligencji poprzez tworzenie aplikacji i rozbudowanego ekosystemu deweloperskiego, zamiast konkurować w dziedzinie modeli podstawowych. Rozwój modeli w Indiach był wolniejszy niż u globalnych rywali ze względu na brak mocy obliczeniowej i ograniczoną dostępność wysokiej jakości danych.
India AI Mission jest częścią szerszego rządowego dążenia do zmniejszenia tej luki. Minister IT Ashwini Vaishnaw ogłosił, że Indie dążą do przyciągnięcia 200 miliardów dolarów inwestycji w AI do 2028 roku i ponad dwukrotnego zwiększenia pojemności GPU w ciągu sześciu miesięcy.
Varya stanowi przykład pragmatycznego podejścia do rozwoju AI, które priorytetowo traktuje dostępność cenową i kulturową świadomość nad competition z globalnymi gigantami technologicznymi.

Bezpłatne narzędzie Deezer wykrywa utwory AI w playlistach z 20 platform. Firma ujawnia, że 44% nowych utworów na platformie to muzyka generowana przez AI.

PathoSage rozwiązuje kluczowy problem halucynacji w modelach AI poprzez oddzielenie procesu zbierania i oceny dowodów medycznych.

Słuchawki z rewolucyjnym chipem THUS AI, rekordową jakością mowy potwierdzoną przez Guinness i etui z ekranem AMOLED. Cena od 699 zł.