Nano Banana 2 Lite generuje obrazy w 4 sekundy za 0,034 dolara, a Gemini Omni Flash wprowadza tworzenie wideo do API za 0,10 dolara za sekundę.

Źródło zdjęcia: The Decoder
Google zaprezentował dwa nowe modele generatywnej sztucznej inteligencji: Nano Banana 2 Lite do szybkiego generowania obrazów oraz Gemini Omni Flash do tworzenia wideo za pomocą API. Nano Banana 2 Lite generuje obrazy w rozdzielczości 1K w zaledwie cztery sekundy za 0,034 dolara za obraz, podczas gdy Gemini Omni Flash pozwala deweloperom tworzyć i edytować dziesięciosekundowe filmy za pomocą promptów tekstowych.
Oba modele są już dostępne przez Google AI Studio, Gemini API oraz platformę Gemini Enterprise Agent Platform. Google zaleca łączenie obu rozwiązań w pipeline'ach deweloperskich.
Nano Banana 2 Lite został zaprojektowany z myślą o szybkim prototypowaniu i pipeline'ach deweloperskich o wysokiej przepustowości. Model, dostępny w API pod nazwą gemini-3.1-flash-lite-image, znacząco obniża koszty w porównaniu do pozostałych modeli z rodziny Nano Banana.
Porównanie cenowe pokazuje wyraźną różnicę: Nano Banana 2 Lite kosztuje 0,034 dolara za obraz, Nano Banana 2 — 0,067 dolara, a Nano Banana Pro — 0,134 dolara (wszystkie w rozdzielczości 1K). Pomimo fokusa na szybkość, Google zapewnia, że model nadal oferuje wiarygodne śledzenie promptów, spójne renderowanie postaci i czytelny tekst w generowanych obrazach.
Model jest już wdrażany w produktach konsumenckich Google, w tym w trybie AI w Google Search, aplikacji Gemini, NotebookLM, Google Photos, Stitch, Google Flow oraz Google Ads. Nano Banana 2 Lite zastępuje oryginalny model Nano Banana oparty na Gemini 2.5.
Gemini Omni Flash, po raz pierwszy zaprezentowany na Google I/O, łączy multimodalne możliwości rozumowania Gemini z generowaniem i edycją wideo. Model jest wyceniany na 0,10 dolara za sekundę wygenerowanego wideo, co odpowiada cenom Veo 3.1 Fast.
Główne mocne strony modelu to konwersacyjna edycja wideo za pomocą naturalnego języka, możliwość mieszania formatów wejściowych (tekst, obrazy, wideo) oraz wykorzystywanie wiedzy o świecie z modelu Gemini. Tekst i grafiki mogą być synchronizowane bezpośrednio z akcjami w wideo.
Obecne ograniczenia obejmują maksymalną długość klipów wynoszącą dziesięć sekund, brak wsparcia dla referencji audio i rozszerzeń scen w API. Schemat API przyjmuje referencje wideo do trzech sekund, ale Google przyznaje, że model jeszcze nie przetwarza ich poprawnie. Spójność postaci między zmianami scen lub ruchami kamery również pozostaje ograniczona.
Google widzi największy potencjał w łączeniu obu modeli. Deweloperzy mogą szybko generować obrazy za pomocą Nano Banana 2 Lite, a następnie przekazywać je jako referencje do Gemini Omni Flash, który animuje je w formie wideo. Interactions API, które jest teraz domyślnym API AI Google, zachowuje historię sesji i kontekst, umożliwiając do trzech kolejnych edycji.
Firma przygotowała trzy demonstracyjne aplikacje pokazujące współpracę modeli. „Anywhere” umieszcza użytkowników w znanych miejscach za pomocą selfie i animuje rezultat. „Space Lift” generuje koncepcje projektowania wnętrz ze zdjęć pomieszczeń i przekształca je w wideo. „Omni Product Studio” konwertuje statyczne zdjęcia produktów w filmy e-commerce.
Oba modele wykorzystują watermarki SynthID do oznaczania treści generowanych przez AI, a weryfikacja jest dostępna przez aplikację Gemini, Gemini w Chrome lub Google Search. Rozwiązania są już dostępne w Google AI Studio, Gemini API oraz platformie Gemini Enterprise Agent Platform.

Infrastruktura AI zużywa tyle wody co małe państwo. Nvidia przedstawiła system chłodzenia, który może drastycznie ograniczyć to zapotrzebowanie.

Test CEO-Bench z Princeton pokazał, że większość modeli AI bankrutuje, prowadząc fikcyjną firmę. Prosty system reguł pokonał niemal wszystkie modele.

Austria oficjalnie lobbuje w Brukseli za przeniesieniem firmy Anthropic do UE w odpowiedzi na amerykańskie ograniczenia dostępu do modeli AI.