30 czerwca 20264 min czytania

Google wprowadza Nano Banana 2 Lite i Gemini Omni Flash — szybkie generowanie obrazów i wideo przez API

Nano Banana 2 Lite generuje obrazy w 4 sekundy za 0,034 dolara, a Gemini Omni Flash wprowadza tworzenie wideo do API za 0,10 dolara za sekundę.

Źródło zdjęcia: The Decoder

Google zaprezentował dwa nowe modele generatywnej sztucznej inteligencji: Nano Banana 2 Lite do szybkiego generowania obrazów oraz Gemini Omni Flash do tworzenia wideo za pomocą API. Nano Banana 2 Lite generuje obrazy w rozdzielczości 1K w zaledwie cztery sekundy za 0,034 dolara za obraz, podczas gdy Gemini Omni Flash pozwala deweloperom tworzyć i edytować dziesięciosekundowe filmy za pomocą promptów tekstowych.

Oba modele są już dostępne przez Google AI Studio, Gemini API oraz platformę Gemini Enterprise Agent Platform. Google zaleca łączenie obu rozwiązań w pipeline'ach deweloperskich.

Kluczowe wnioski

Nano Banana 2 Lite generuje obrazy w rozdzielczości 1K w cztery sekundy za 0,034 dolara za obraz, będąc najtańszą opcją w rodzinie Nano Banana.
Gemini Omni Flash wprowadza generowanie wideo do API po raz pierwszy, umożliwiając tworzenie dziesięciosekundowych klipów za 0,10 dolara za sekundę.
Google zaleca łączenie obu modeli: szybkie generowanie obrazów przez Nano Banana 2 Lite, a następnie ich animacja w Gemini Omni Flash.
Model Nano Banana 2 Lite zastępuje oryginalny Nano Banana oparty na Gemini 2.5 i jest już wdrażany w produktach konsumenckich Google.
Oba modele używają watermarków SynthID do oznaczania treści generowanych przez AI.

Nano Banana 2 Lite — szybkość i efektywność kosztowa

Nano Banana 2 Lite został zaprojektowany z myślą o szybkim prototypowaniu i pipeline'ach deweloperskich o wysokiej przepustowości. Model, dostępny w API pod nazwą gemini-3.1-flash-lite-image, znacząco obniża koszty w porównaniu do pozostałych modeli z rodziny Nano Banana.

Porównanie cenowe pokazuje wyraźną różnicę: Nano Banana 2 Lite kosztuje 0,034 dolara za obraz, Nano Banana 2 — 0,067 dolara, a Nano Banana Pro — 0,134 dolara (wszystkie w rozdzielczości 1K). Pomimo fokusa na szybkość, Google zapewnia, że model nadal oferuje wiarygodne śledzenie promptów, spójne renderowanie postaci i czytelny tekst w generowanych obrazach.

Model jest już wdrażany w produktach konsumenckich Google, w tym w trybie AI w Google Search, aplikacji Gemini, NotebookLM, Google Photos, Stitch, Google Flow oraz Google Ads. Nano Banana 2 Lite zastępuje oryginalny model Nano Banana oparty na Gemini 2.5.

Gemini Omni Flash — wideo w API

Gemini Omni Flash, po raz pierwszy zaprezentowany na Google I/O, łączy multimodalne możliwości rozumowania Gemini z generowaniem i edycją wideo. Model jest wyceniany na 0,10 dolara za sekundę wygenerowanego wideo, co odpowiada cenom Veo 3.1 Fast.

Główne mocne strony modelu to konwersacyjna edycja wideo za pomocą naturalnego języka, możliwość mieszania formatów wejściowych (tekst, obrazy, wideo) oraz wykorzystywanie wiedzy o świecie z modelu Gemini. Tekst i grafiki mogą być synchronizowane bezpośrednio z akcjami w wideo.

Obecne ograniczenia obejmują maksymalną długość klipów wynoszącą dziesięć sekund, brak wsparcia dla referencji audio i rozszerzeń scen w API. Schemat API przyjmuje referencje wideo do trzech sekund, ale Google przyznaje, że model jeszcze nie przetwarza ich poprawnie. Spójność postaci między zmianami scen lub ruchami kamery również pozostaje ograniczona.

Integracja modeli i zastosowania praktyczne

Google widzi największy potencjał w łączeniu obu modeli. Deweloperzy mogą szybko generować obrazy za pomocą Nano Banana 2 Lite, a następnie przekazywać je jako referencje do Gemini Omni Flash, który animuje je w formie wideo. Interactions API, które jest teraz domyślnym API AI Google, zachowuje historię sesji i kontekst, umożliwiając do trzech kolejnych edycji.

Firma przygotowała trzy demonstracyjne aplikacje pokazujące współpracę modeli. „Anywhere” umieszcza użytkowników w znanych miejscach za pomocą selfie i animuje rezultat. „Space Lift” generuje koncepcje projektowania wnętrz ze zdjęć pomieszczeń i przekształca je w wideo. „Omni Product Studio” konwertuje statyczne zdjęcia produktów w filmy e-commerce.

Oba modele wykorzystują watermarki SynthID do oznaczania treści generowanych przez AI, a weryfikacja jest dostępna przez aplikację Gemini, Gemini w Chrome lub Google Search. Rozwiązania są już dostępne w Google AI Studio, Gemini API oraz platformie Gemini Enterprise Agent Platform.

#Gemini Omni Flash #Nano Banana #generowanie obrazów #generowanie wideo #Google

Udostępnij

Źródła

The Decoder

Poprzedni

Claude od Anthropic działa teraz na procesorach NVIDIA GB300 w Azure

Następny

Meta wypuszcza Llama 4: open source rewolucja dorównująca GPT-4o

Podobne Publikacje

Narzędzia i Aplikacje

Nvidia rozwiązuje problem zużycia wody przez AI. Nowy system chłodzenia może zrewolucjonizować centra danych

Infrastruktura AI zużywa tyle wody co małe państwo. Nvidia przedstawiła system chłodzenia, który może drastycznie ograniczyć to zapotrzebowanie.

3 min28 czerwca

Badania i Nauka

Tylko trzy modele AI przetrwały 500-dniowy test zarządzania startupem z zyskiem

Test CEO-Bench z Princeton pokazał, że większość modeli AI bankrutuje, prowadząc fikcyjną firmę. Prosty system reguł pokonał niemal wszystkie modele.

4 min28 czerwca

Biznes i Rynek

Austria lobbuje za przeniesieniem Anthropic do UE po amerykańskich ograniczeniach AI

Austria oficjalnie lobbuje w Brukseli za przeniesieniem firmy Anthropic do UE w odpowiedzi na amerykańskie ograniczenia dostępu do modeli AI.

4 min30 czerwca

Kluczowe wnioski

Nano Banana 2 Lite generuje obrazy w rozdzielczości 1K w cztery sekundy za 0,034 dolara za obraz, będąc najtańszą opcją w rodzinie Nano Banana.

Gemini Omni Flash wprowadza generowanie wideo do API po raz pierwszy, umożliwiając tworzenie dziesięciosekundowych klipów za 0,10 dolara za sekundę.

Google zaleca łączenie obu modeli: szybkie generowanie obrazów przez Nano Banana 2 Lite, a następnie ich animacja w Gemini Omni Flash.

Model Nano Banana 2 Lite zastępuje oryginalny Nano Banana oparty na Gemini 2.5 i jest już wdrażany w produktach konsumenckich Google.

Oba modele używają watermarków SynthID do oznaczania treści generowanych przez AI.

Nano Banana 2 Lite — szybkość i efektywność kosztowa

Gemini Omni Flash — wideo w API

Integracja modeli i zastosowania praktyczne