Gemini 3 Pro & Flash, Gemini 3 Pro Image (nano banana pro), and the latest Gemini Live API native audio models are now available to use with Firebase AI Logic on all platforms!

Gemini 2.0 Flash and Flash-Lite models will be retired on March 31, 2026. To avoid service disruption, update to a newer model like gemini-2.5-flash-lite. Learn more.

Informacje o obsługiwanych modelach

W przypadku aplikacji mobilnych i internetowych pakiety SDK Firebase AI Logic umożliwiają interakcję z obsługiwanymi Gemini modelami i Imagen modelami bezpośrednio z aplikacji.

Modele Gemini są uważane za wielomodalne, ponieważ potrafią przetwarzać, a nawet generować różne rodzaje treści, w tym tekst, kod, pliki PDF, obrazy, filmy i dźwięk. Imagen można używać do generowania obrazów na podstawie tekstu.

Zapoznaj się też z naszymi najczęstszymi pytaniami dotyczącymi wszystkich modeli, które Firebase AI Logic obsługuje i których nie obsługuje.

Modele ogólnego zastosowania

Przejdź do porównań modeli

NASZ NAJBARDZIEJ INTELIGENTNY MODEL

Gemini 3 Pro

gemini-3-pro-preview

Nasz najlepszy model do rozpoznawania multimodalnego i nasz najpotężniejszy model agentowy i model do vibe codingu, zapewniający bogatsze wizualizacje i głębszą interaktywność – zbudowany na fundamencie najnowocześniejszego rozumowania. (wymagane rozliczenia)

NASZ NAJSZYBSZY I NAJBARDZIEJ INTELIGENTNY MODEL

Gemini 3 Flash

gemini-3-flash-preview

Nasz najbardziej inteligentny model stworzony z myślą o szybkości, wydajności i kosztach. Umożliwia wykonywanie codziennych zadań dzięki ulepszonemu rozumowaniu, a jednocześnie radzi sobie z najbardziej złożonymi przepływami pracy opartymi na agentach. (płatności nie są wymagane)

NASZ ZAAWANSOWANY MODEL MYŚLENIA

Gemini 2.5 Pro

gemini-2.5-pro

Nasz najnowocześniejszy model myślenia, który potrafi rozwiązywać złożone problemy związane z kodowaniem, matematyką i naukami ścisłymi, a także analizować duże zbiory danych, bazy kodu i dokumenty przy użyciu długiego kontekstu. (płatności nie są wymagane)

SZYBKOŚĆ I INTELIGENCJA

Gemini 2.5 Flash

gemini-2.5-flash

Nasz najlepszy model pod względem stosunku ceny do wydajności, który oferuje wszechstronne możliwości. 2.5 Flash najlepiej sprawdza się w przypadku przetwarzania na dużą skalę, zadań o krótkim czasie oczekiwania i dużej liczbie zapytań, które wymagają myślenia, oraz zastosowań opartych na agentach. (płatności nie są wymagane)

ULTRA FAST

Gemini 2.5 Flash-Lite

gemini-2.5-flash-lite

Nasz najszybszy model flash zoptymalizowany pod kątem niskich kosztów i wysokiej przepustowości. (płatności nie są wymagane)

Modele generujące obrazy

Obrazy możesz generować za pomocą modeli Gemini lub Imagen.

Przejdź do porównań modeli

Gemini

Gemini 3 Pro Image (czyli nano banana pro)

gemini-3-pro-image-preview

Zaprojektowany do profesjonalnego tworzenia komponentów i złożonych instrukcji. Wykorzystuje ona grounding w rzeczywistym świecie za pomocą wyszukiwarki Google, domyślny proces „myślenia”, który udoskonala kompozycję przed wygenerowaniem obrazu, i może generować obrazy w rozdzielczości do 4K. (wymagane rozliczenia)

Gemini 2.5 Flash Image (czyli nano banana)

gemini-2.5-flash-image

Zaprojektowany z myślą o szybkości i wydajności. Jest zoptymalizowany pod kątem zadań o dużej liczbie operacji i małych opóźnieniach, a generowane przez niego obrazy mają rozdzielczość 1024 pikseli. (wymagane rozliczenia)

Imagen

Imagen 4

imagen-4.0-generate-001

Generuje realistyczne obrazy wysokiej jakości na podstawie promptów tekstowych w języku naturalnym. (wymagane rozliczenia)

Imagen 4 Fast

imagen-4.0-fast-generate-001

Generuje obrazy do prototypowania lub zastosowań wymagających krótkiego czasu oczekiwania. (wymagane rozliczenia)

Imagen 4 Ultra

imagen-4.0-ultra-generate-001

Generuje realistyczne obrazy wysokiej jakości na podstawie promptów tekstowych w języku naturalnym. (wymagane rozliczenia)

Modele generujące dźwięk

Możesz generować strumieniowe audio za pomocą modeli, które obsługują Gemini Live API.

Przejdź do porównań modeli

Gemini 2.5 Flash z natywnym dźwiękiem interfejsu Gemini Live API

Gemini Developer API: gemini-2.5-flash-native-audio-preview-12-2025

Vertex AI Gemini API: gemini-live-2.5-flash-native-audio

Umożliwia interakcje głosowe i wideo w czasie rzeczywistym z niewielkimi opóźnieniami przy użyciu modelu Gemini, który jest dwukierunkowy. (płatności nie są wymagane)

W dalszej części tej strony znajdziesz szczegółowe informacje o modelach obsługiwanych przez Firebase AI Logic.

Porównanie modeli:
- Obsługiwane wejścia i wyjścia
- Ogólne porównanie obsługiwanych funkcji
- Specyfikacje i ograniczenia, np. maksymalna liczba tokenów wejściowych lub maksymalna długość filmu wejściowego
Opis wersjonowania modeli, a w szczególności ich wersji stabilnych, aktualizowanych automatycznie, wersji testowych i eksperymentalnych.
Listy dostępnych nazw modeli, które można uwzględnić w kodzie podczas inicjowania.
Listy obsługiwanych języków w przypadku modeli

U dołu tej strony możesz wyświetlić szczegółowe informacje o modelach poprzedniej generacji.

Porównanie modeli

Każdy model ma inne możliwości, które pozwalają obsługiwać różne przypadki użycia. Pamiętaj, że każda tabela w tej sekcji opisuje poszczególne modele w przypadku użycia z Firebase AI Logic. Każdy model może mieć dodatkowe możliwości, które nie są dostępne podczas korzystania z naszych pakietów SDK.

Jeśli nie możesz znaleźć potrzebnych informacji w kolejnych podsekcjach, więcej informacji znajdziesz w dokumentacji wybranego dostawcy interfejsu API:

Gemini Developer API:Gemini i Imagen
Vertex AI Gemini API:Gemini i Imagen

Obsługiwane wejścia i wyjścia

Oto obsługiwane typy danych wejściowych i wyjściowychw przypadku używania poszczególnych modeli z Firebase AI Logic:

	<span="notranslate">Gemini 3 Pro, Flash </span="notranslate">	<span="notranslate">Gemini 3 Pro Image </span="notranslate">	<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.5 Flash- Live ******* </span="notranslate">	Imagen (wygeneruj)	Imagen (możliwość)
Typy danych wejściowych
Tekst					(streaming)
Kod
Dokumenty (pliki PDF lub zwykły tekst)
Obrazy
Wideo					(streaming)
Dźwięk					(streaming)
Typy danych wyjściowych
Tekst
Tekst (strumieniowanie)					(transkrypcja)
Kod
Uporządkowane dane wyjściowe (np. JSON)
Obrazy
Dźwięk					(streaming)

Więcej informacji o obsługiwanych typach plików znajdziesz w artykule Obsługiwane pliki wejściowe i wymagania.

Obsługiwane funkcje i możliwości

Oto obsługiwane funkcje i możliwości w przypadku korzystania z poszczególnych modeli z Firebase AI Logic:

	<span="notranslate">Gemini 3 Pro Image </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.5 Flash- Live ******* </span="notranslate">
Myślenie
Generowanie tekstu na podstawie danych wejściowych zawierających tylko tekst lub danych multimodalnych	przeplatane lub jako część obrazu	przeplatane lub jako część obrazu	tylko transkrypcja,
Generowanie obrazów (Gemini lub Imagen)
Edytowanie obrazów (Gemini lub Imagen)
Wygeneruj dźwięk			tylko streaming
Generowanie danych wyjściowych w formacie strukturalnym (np. JSON)
Analizowanie dokumentów (pliki PDF lub zwykły tekst)
Analizowanie obrazów (vision)
Analizowanie filmu (vision)			tylko streaming
Analizowanie dźwięku			tylko streaming
Czat wieloetapowy			tylko streaming
Dwukierunkowe przesyłanie strumieniowe w trybie multimodalnym
Instrukcje systemowe
Licz tokeny

Obsługiwane narzędzia

Oto obsługiwane narzędzia, gdy używasz każdego modelu z Firebase AI Logic:

	<span="notranslate">Gemini 3 Pro, Flash </span="notranslate">	<span="notranslate">Gemini 3 Pro Image </span="notranslate">	<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.5 Flash- Live ******* </span="notranslate">	Imagen (wygeneruj)	Imagen (możliwość)
Wywoływanie funkcji
Wykonanie kodu
Kontekst adresu URL
Grounding z użyciem wyszukiwarki Google

Specyfikacje i ograniczenia

Oto specyfikacje i ograniczenia dotyczące korzystania z poszczególnych modeli z parametrem Firebase AI Logic:

Właściwość	<span="notranslate">Gemini 3 Pro, Flash </span="notranslate">	<span="notranslate">Gemini 3 Pro Image </span="notranslate">	<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate">	<span="notranslate">Gemini 2.5 Flash Image </span="notranslate">	<span="notranslate">Gemini 2.5 Flash- Live ******* </span="notranslate">	Imagen (wygeneruj)	Imagen (możliwość)
Limit tokenów wejściowych*	1 048 576 tokenów	65 536 tokenów	1 048 576 tokenów	32 768 tokenów	32 tys. tokenów (domyślnie; można zwiększyć do 128 tys.)	480 tokenów	480 tokenów
Limit tokenów wyjściowych*	65 536 tokenów	32 768 tokenów	65 536 tokenów	8192 tokeny	64 tys. tokenów	---	---
Data graniczna wiedzy	Styczeń 2025 r.	Styczeń 2025 r.	Styczeń 2025 r.	Czerwiec 2025 r.	Styczeń 2025 r.	---	---
Pliki PDF (na żądanie)
Maksymalna liczba wejściowych plików PDF **	900 plików	14 plików	3000 plików	3 pliki	---	---	---
Maksymalna liczba stron w pliku PDF **	900 stron	14 stron	1000 stron	3 strony	---	---	---
Maksymalny rozmiar wejściowego pliku PDF	50 MB	50 MB	50 MB	50 MB	---	---	---
Obrazy (z uwzględnieniem żądań)
Maksymalna liczba obrazów wejściowych	1000 obrazów	14 obrazów	3000 obrazów	3 obrazy	---	---	4 obrazy
Maksymalna liczba obrazów wyjściowych	---	10 obrazów	---	10 obrazów	---	4 obrazy	4 obrazy
Maksymalny rozmiar na wejściowy obraz zakodowany w formacie base64	7 MB	7 MB	7 MB	7 MB	---	---	---
Wideo (z uwzględnieniem żądań)
Maksymalna liczba plików wideo wejściowych	10 plików	---	10 plików	---	---	---	---
Maksymalna długość wszystkich filmów wejściowych (tylko klatki)	~60 minut	---	~60 minut	---	---	---	---
Maksymalna długość wszystkich filmów wejściowych (klatki + dźwięk)	~45 minut	---	~45 minut	---	---	---	---
Dźwięk (z uwzględnieniem żądań)
Maksymalna liczba wejściowych plików audio	1 plik	---	1 plik	---	---	---	---
Maksymalna liczba wyjściowych plików audio	---	---	---	---	---	---	---
Maksymalna długość wszystkich wejściowych plików audio	Ok.8,4 godziny	---	Ok.8,4 godziny	---	---	---	---
Maksymalna długość wszystkich wyjściowych plików audio	---	---	---	---	---	---	---

^{*W przypadku wszystkich modeli Gemini token odpowiada około 4 znakom, więc 100 tokenów to około 60–80 słów w języku angielskim. W przypadku modeli Gemini możesz określić łączną liczbę tokenów w żądaniach za pomocą countTokens.}

^{**
Pliki PDF są traktowane jako obrazy, więc jedna strona pliku PDF jest traktowana jako jeden obraz. Liczba stron dozwolonych w żądaniu jest ograniczona do liczby obrazów, które może obsługiwać model.}

^{***
Modele Gemini 2.5 Flash-Live to natywne modele audio, które obsługują Gemini Live API.}

Znajdowanie dodatkowych szczegółowych informacji

Limity i ceny są różne w przypadku poszczególnych modeli. Ceny zależą też od danych wejściowych i wyjściowych.
Więcej informacji o obsługiwanych typach plików wejściowych, sposobie określania typu MIME oraz o tym, jak zadbać o to, aby pliki wejściowe i żądania multimodalne spełniały wymagania i były zgodne ze sprawdzonymi metodami, znajdziesz w artykule Obsługiwane pliki wejściowe i wymagania.

Ważne: łączny rozmiar żądania nie może przekraczać 20 MB. Aby wysyłać duże pliki, zapoznaj się z opcjami przesyłania plików w żądaniach multimodalnych.

Wersje modeli i wzorce nazewnictwa

Modele są dostępne w wersjach stabilnej, testowej i eksperymentalnej. Dla wygody obsługiwane są aliasy bez jawnych wartości wersji.

Aby znaleźć konkretne nazwy modeli do użycia w kodzie, zapoznaj się z sekcją „Dostępne nazwy modeli” poniżej.

Typ wersji / Etap publikacji		Opis	Wzorzec nazwy modelu
Stabilna		*Stabilne* wersje są dostępne i obsługiwane do użytku produkcyjnego od daty premiery. Stabilna wersja modelu jest zwykle udostępniana z datą wycofania, która oznacza ostatni dzień, w którym model jest dostępny. Po tej dacie model nie będzie już dostępny ani obsługiwany przez Google.	Gemini 2.5 Nazwy modeli w stabilnych wersjach nie mają sufiksu. Przykład: `gemini-2.5-pro` Modele Gemini 2.0 i Imagen Nazwy modeli w stabilnych wersjach mają na końcu 3-cyfrowy numer wersji. Przykład: `gemini-2.0-flash-001` Przykład: `imagen-3.0-generate-002`
	Automatycznie aktualizowany alias wersji stabilnej (tylko modele Gemini 2.0)	*Automatycznie aktualizowane* aliasy stabilne zawsze wskazują najnowszą stabilną wersję danego modelu. Jeśli zostanie opublikowana nowa wersja stabilna, alias automatycznie aktualizowany zacznie automatycznie wskazywać tę nową wersję stabilną.	Gemini 2.0 tylko modele Nazwy modeli aliasów nie mają sufiksu Przykład: `gemini-2.0-flash`
Podgląd		Wersje *przedpremierowe* mają nowe funkcje i są uważane za niestabilne. Te modele nie są zalecane do użytku w środowisku produkcyjnym, mają bardziej restrykcyjne limity żądań i mogą podlegać wymaganiom dotyczącym płatności. Modele te są wycofywane w ciągu kilku tygodni lub miesięcy po wydaniu powiązanej z nimi stabilnej wersji. W przypadku Vertex AI Gemini API modele w wersji podglądowej wydane po czerwcu 2025 r. zwykle wymagają ustawienia lokalizacji modelu na `global`.	Nazwy modeli w wersji testowej mają dopisek `-preview`, a często także datę wydania modelu (`-MM-DD` w przypadku starszych modeli lub `-MM-YYYY` w przypadku nowszych modeli). Przykłady: `gemini-2.5-flash-preview-04-17` (wydany 17 kwietnia 2025 r.) lub `gemini-2.5-flash-preview-09-2025` (wydany we wrześniu 2025 r.) lub `gemini-3-pro-preview` (wydany w listopadzie 2025 r.)
Eksperymentalne		Wersje *eksperymentalne* mają nowe funkcje i są uważane za niestabilne. Te modele nie są zalecane do użytku w środowisku produkcyjnym i mają bardziej restrykcyjne limity żądań. Modele eksperymentalne służą do zbierania opinii i umożliwiają testowanie naszych najnowszych funkcji. Modele te są wycofywane w ciągu kilku tygodni lub miesięcy po wydaniu powiązanej z nimi stabilnej wersji. W przypadku Vertex AI Gemini API modele eksperymentalne wydane po czerwcu 2025 r. wymagają ustawienia lokalizacji modelu na `global`.	Nazwy modeli wersji eksperymentalnych są uzupełniane o `-exp` oraz datę wydania modelu (`-MM-DD`). Przykład: `gemini-2.5-pro-exp-03-25` (wydany 25 marca 2025 r.)
Jestem na emeryturze		Wersje *wycofane* są po dacie wycofania i zostały trwale wyłączone. Wycofane modele nie są już dostępne ani obsługiwane przez Google, a żądanie z użyciem nazwy wycofanego modelu zwraca błąd 404.	---

Dostępne nazwy modeli

Nazwy modeli to konkretne wartości, które umieszczasz w kodzie podczas inicjowania modelu.

Przejdź do Gemini nazw modeli Przejdź do Imagen nazw modeli

Programowe wyświetlanie listy wszystkich dostępnych modeli

Za pomocą interfejsu API REST możesz wyświetlić listę wszystkich dostępnych nazw modeli:

Gemini Developer API: wywołaj models.listpunkt końcowy
Vertex AI Gemini API: wywołaj publishers.models.listpunkt końcowy

Pamiętaj, że zwrócona lista będzie zawierać wszystkie modele obsługiwane przez dostawców interfejsu API, ale Firebase AI Logic obsługuje tylko modele Gemini i Imagen opisane na tej stronie. Pamiętaj też, że automatycznie aktualizowane aliasy (np. gemini-2.0-flash) nie są wymienione, ponieważ są aliasami ułatwiającymi korzystanie z modelu podstawowego.

Gemini nazwy modeli

Przykłady inicjowania na Twojej platformie znajdziesz w przewodniku dla początkujących.

Szczegółowe informacje o etapach udostępniania (zwłaszcza przypadki użycia, rozliczenia i wycofanie) znajdziesz w artykule Wersje modeli i wzorce nazewnictwa.

Ważne: nazwy modeli stabilnych Gemini 2.5 nie mają trzycyfrowego sufiksu ani nie mają automatycznie aktualizowanego aliasu.

Jeśli korzystasz z Vertex AI Gemini API, wszystkie modele Gemini 3 i Gemini 2.5 wersji podglądowych (z wyjątkiem modeli Gemini Live API) wydane po czerwcu 2025 r. będą dostępne tylko w lokalizacji global.

Gemini 3 Pro nazwy modeli

^{Wymaga abonamentu Blaze z płatnością według wykorzystania niezależnie od dostawcy Gemini API.}

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-3-pro-preview`	Wersja podglądowa: Gemini 3 Pro	Podgląd	2025-11-18	Jeszcze nieznany

Gemini 3 Flash nazwy modeli

^{Nie wymaga planu cenowego Blaze z płatnością według wykorzystania, jeśli używasz modelu Gemini Developer API (zwykle modele w wersji podglądowej wymagają płatnego abonamentu).}

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-3-flash-preview`	Wersja podglądowa: Gemini 3 Flash	Podgląd	2025-12-17	Jeszcze nieznany

Gemini 3 Pro Image nazwy modeli (np. „nano banana pro”)

^{Wymaga abonamentu Blaze z płatnością według wykorzystania niezależnie od dostawcy Gemini API.}

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-3-pro-image-preview`	Wersja podglądu Gemini 3 Pro Image (znana też jako „nano banana pro”)	Podgląd	2025-11-20	Jeszcze nieznany

Gemini 2.5 Pro nazwy modeli

^{Niewymaga abonamentu Blaze (płatność według wykorzystania), jeśli używasz Gemini Developer API.}

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.5-pro`	Stabilna wersja Gemini 2.5 Pro	Stabilny	2025-06-17	Nie wcześniej niż 17 czerwca 2026 r.

Gemini 2.5 Flash nazwy modeli

^{Niewymaga abonamentu Blaze (płatność według wykorzystania), jeśli używasz Gemini Developer API.}

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.5-flash`	Stabilna wersja Gemini 2.5 Flash	Stabilny	2025-06-17	Nie wcześniej niż 17 czerwca 2026 r.

Gemini 2.5 Flash‑Lite nazwy modeli

^{Niewymaga abonamentu Blaze (płatność według wykorzystania), jeśli używasz Gemini Developer API.}

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.5-flash-lite`	Stabilna wersja Gemini 2.5 Flash‑Lite	Stabilny	2025-07-22	Nie wcześniej niż 22 lipca 2026 r.

Gemini 2.5 Flash Image nazwy modeli (czyli „nano banana”)

^{Wymaga abonamentu Blaze z płatnością według wykorzystania niezależnie od dostawcy Gemini API.}

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.5-flash-image`	Wersja stabilna dla Gemini 2.5 Flash Image (czyli „nano banana”)	Stabilny	2025-10-02	Nie wcześniej niż 2026-10-02

Gemini 2.5 Flash Live nazwy modeli

^{Nie wymaga planu cenowego Blaze z płatnością według wykorzystania, jeśli używasz modelu Gemini Developer API (zwykle modele w wersji podglądowej wymagają płatnego abonamentu).}

Gemini 2.5 Flash Live to modele natywnego dźwięku, które obsługują Gemini Live API. Mimo że model ma różne nazwy w zależności od Gemini dostawcy interfejsu API, jego działanie i funkcje są takie same.

Gemini Developer API Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.5-flash-native-audio-preview-12-2025` ¹	Najnowsza wersja podglądowa Live API na Gemini Developer API	Podgląd	2025-12-12	Jeszcze nieznany
`gemini-2.5-flash-native-audio-preview-09-2025` ¹	Wstępna wersja podglądu Live API na Gemini Developer API	Podgląd	2025-09-18	Jeszcze nieznany

Vertex AI Gemini API Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-live-2.5-flash-native-audio` ²	Wersja stabilna Live API na Vertex AI Gemini API	Stabilny	2025-12-12	Nie wcześniej niż 12 grudnia 2026 r.
`gemini-live-2.5-flash-preview-native-audio-09-2025` ²	Wersja podglądowa Live API na Vertex AI Gemini API	Podgląd	2025-09-18	Jeszcze nieznany

^{1 Obsługiwane tylko przez Gemini Developer API.
Chociaż są to modele w wersji podglądowej, są one dostępne w ramach „bezpłatnej wersji” Gemini Developer API.}
^{2 Tylko obsługiwane przez Vertex AI Gemini API.
Te modele nie są też obsługiwane w lokalizacji global.}

Imagen nazwy modeli

Przykłady inicjowania na Twojej platformie znajdziesz w przewodniku generowania obrazów za pomocą Imagen.

Szczegółowe informacje o etapach udostępniania (zwłaszcza przypadki użycia, rozliczenia i wycofanie) znajdziesz w artykule Wersje modeli i wzorce nazewnictwa.

Imagen 4 nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-4.0-generate-001`	Stabilna wersja Imagen 4	Stabilny	2025-08-14	Nie wcześniej niż 14 sierpnia 2026 r.

Imagen 4 Fast nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-4.0-fast-generate-001`	Stabilna wersja Imagen 4 Fast	Stabilny	2025-08-14	Nie wcześniej niż 14 sierpnia 2026 r.

Imagen 4 Ultra nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-4.0-ultra-generate-001`	Stabilna wersja Imagen 4 Ultra	Stabilny	2025-08-14	Nie wcześniej niż 14 sierpnia 2026 r.

Imagen 3 Capability nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-3.0-capability-001` ²	Początkowa stabilna wersja Imagen 3 Capability	Stabilny	2024-12-10	Nie wcześniej niż 10 grudnia 2025 r.

^{2 Nie jest obsługiwane przez Gemini Developer API niezależnie od sposobu dostępu.}

Obsługiwane języki

Gemini

Wszystkie modele Gemini rozumieją te języki i mogą w nich odpowiadać:

angielski (en), arabski (ar), bengalski (bn), bułgarski (bg), chiński (uproszczony i tradycyjny) (zh), chorwacki (hr), czeski (cs), duński (da), estoński (et), fiński (fi), francuski (fr), grecki (el), hebrajski (iw), hindi (hi), hiszpański (es), indonezyjski (id), japoński (ja), koreański (ko), litewski (lt), łotewski (lv), niderlandzki (nl), niemiecki (de), norweski (no), polski (pl), portugalski (pt), rosyjski (ru), rumuński (ro), serbski (sr), słowacki (sk), słoweński (sl), suahili (sw), szwedzki (sv), tajski (th), turecki (tr), ukraiński (uk), węgierski (hu), wietnamski (vi), włoski (it).
Modele Gemini 2.0 Flash, Gemini 1.5 Pro i Gemini 1.5 Flash rozumieją i odpowiadają w tych dodatkowych językach:

afrikaans (af), amharski (am), asamski (as), azerbejdżański (az), białoruski (be), bośniacki (bs), kataloński (ca), cebuański (ceb), korsykański (co), walijski (cy), malediwski (dv), esperanto (eo), baskijski (eu), perski (fa), filipiński (tagalski) (fil), fryzyjski (fy), irlandzki (ga), szkocki gaelicki (gd), galicyjski (gl), gudżarati (gu), hausa (ha), hawajski (haw), hmong (hmn), kreolski haitański (ht), ormiański (hy), igbo (ig), islandzki (is), jawajski (jv), gruziński (ka), kazachski (kk), khmerski (km), kannada (kn), krio (kri), kurdyjski (ku), kirgiski (ky), łaciński (la), luksemburski (lb), laotański (lo), malgaski (mg), maoryski (mi), macedoński (mk), malajalam (ml), mongolski (mn), meitei (manipuri) (mni-Mtei), marathi (mr), malajski (ms), maltański (mt), birmański (my), nepalski (ne), nyanja (chichewa) (ny), odia (orija) (or), pendżabski (pa), paszto (ps), sindhi (sd), syngaleski (si), samoański (sm), shona (sn), somalijski (so), albański (sq), sotho (st), sundajski (su), tamilski (ta), telugu (te), tadżycki (tg), ujgurski (ug), urdu (ur), uzbecki (uz), xhosa (xh), jidysz (yi), joruba (yo), zulu (zu)

Imagen

Ogólna dostępność: angielski
Podgląd: chiński (uproszczony), chiński (tradycyjny), hiszpański, japoński, koreański, hindi, portugalski

Informacje o poprzednich modelach

Są one aktywne, ale należą do poprzedniej generacji. W miarę możliwości zalecamy korzystanie z jednego z najnowszych modeli.

Modele

Gemini modelu

gemini-2.0-flash-001 (i jego automatycznie aktualizowany alias gemini-2.0-flash)
gemini-2.0-flash-lite-001 (i jego automatycznie aktualizowany alias gemini-2.0-flash-lite)

Informacje o starszych modelach Gemini Live API znajdziesz w dokumentacji dostawcy Gemini API:

Imagen modelu

imagen-3.0-generate-002
imagen-3.0-fast-generate-001

Wyświetlanie obsługiwanych danych wejściowych i wyjściowych modeli poprzedniej generacji

Oto typy danych wejściowych i wyjściowych w przypadku używania poszczególnych modeli z Firebase AI Logic:

	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">
Typy danych wejściowych
Tekst
Tekst (strumieniowanie)
Kod
Dokumenty (pliki PDF lub zwykły tekst)
Obrazy
Wideo
Dźwięk
Audio (streaming)
Typy danych wyjściowych
Tekst
Tekst (strumieniowanie)
Kod
Uporządkowane dane wyjściowe (np. JSON)
Obrazy
Dźwięk
Audio (streaming)

Obsługiwane funkcje i możliwości modeli poprzedniej generacji

Oto możliwości i funkcje przy korzystaniu z poszczególnych modeli z Firebase AI Logic:

	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">
Myślenie
Generowanie tekstu na podstawie danych wejściowych zawierających tylko tekst lub danych multimodalnych
Generowanie obrazów (Gemini lub Imagen)
Edytowanie obrazów (Gemini lub Imagen)
Wygeneruj dźwięk
Generowanie danych wyjściowych w formacie strukturalnym (np. JSON)
Analizowanie dokumentów (pliki PDF lub zwykły tekst)
Analizowanie obrazów (vision)
Analizowanie filmu (vision)
Analizowanie dźwięku
Czat wieloetapowy
Dwukierunkowe przesyłanie strumieniowe w trybie multimodalnym
Wywoływanie funkcji
Wykonanie kodu
Grounding z użyciem wyszukiwarki Google
Instrukcje systemowe
Licz tokeny

Specyfikacje i ograniczenia modeli poprzedniej generacji

Oto specyfikacje i ograniczenia dotyczące korzystania z poszczególnych modeli z parametrem Firebase AI Logic:

Właściwość	<span="notranslate">Gemini 2.0 Flash </span="notranslate">	<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate">
Okno kontekstu* Łączny limit tokenów (dane wejściowe + wyjściowe)	1 048 576 tokenów	1 048 576 tokenów
Limit tokenów wyjściowych*	8192 tokeny	8192 tokeny
Data graniczna wiedzy	Czerwiec 2024 r.	Czerwiec 2024 r.
Pliki PDF (na żądanie)
Maksymalna liczba wejściowych plików PDF **	3000 plików	3000 plików
Maksymalna liczba stron w pliku PDF **	1000 stron	1000 stron
Maksymalny rozmiar wejściowego pliku PDF	50 MB	50 MB
Obrazy (z uwzględnieniem żądań)
Maksymalna liczba obrazów wejściowych	3000 obrazów	3000 obrazów
Maksymalna liczba obrazów wyjściowych	---	---
Maksymalny rozmiar na wejściowy obraz zakodowany w formacie base64	7 MB	7 MB
Wideo (z uwzględnieniem żądań)
Maksymalna liczba plików wideo wejściowych	10 plików	10 plików
Maksymalna długość wszystkich filmów wejściowych (tylko klatki)	~60 minut	~60 minut
Maksymalna długość wszystkich filmów wejściowych (klatki + dźwięk)	~45 minut	~45 minut
Dźwięk (z uwzględnieniem żądań)
Maksymalna liczba wejściowych plików audio	1 plik	1 plik
Maksymalna liczba wyjściowych plików audio	---	---
Maksymalna długość wszystkich wejściowych plików audio	Ok.8,4 godziny	Ok.8,4 godziny
Maksymalna długość wszystkich wyjściowych plików audio	---	---

Dostępne nazwy modeli poprzedniej generacji (wraz z datami wycofania)

Nazwy modeli to konkretne wartości, które umieszczasz w kodzie podczas inicjowania modelu.

Modele Gemini

Modele

Gemini 2.0 Flash i Gemini 2.0 Flash‑Lite zostaną wycofane 31 marca 2026 r. Aby uniknąć przerw w działaniu usługi, przejdź na nowszy model, np. gemini-2.5-flash-lite. Więcej informacji

Gemini 2.0 Flash nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.0-flash-001`	Najnowsza stabilna wersja Gemini 2.0 Flash	Stabilny	2025-02-05	2026-03-31
`gemini-2.0-flash`	Automatycznie aktualizowany alias wskazujący najnowszą stabilną wersję Gemini 2.0 Flash (obecnie `gemini-2.0-flash-001`)	Stabilny	2025-02-10	2026-03-31

Gemini 2.0 Flash‑Lite nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`gemini-2.0-flash-lite-001`	Najnowsza stabilna wersja Gemini 2.0 Flash‑Lite	Stabilny	2025-02-25	2026-03-31
`gemini-2.0-flash-lite`	Automatycznie aktualizowany alias wskazujący najnowszą stabilną wersję Gemini 2.0 Flash‑Lite (obecnie `gemini-2.0-flash-lite-001`)	Stabilny	2025-02-25	2026-03-31

Modele Imagen

Imagen 3 nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-3.0-generate-002`	Najnowsza stabilna wersja Imagen 3	Stabilny	2025-01-23	Nie wcześniej niż 23 stycznia 2026 r.
`imagen-3.0-generate-001` ³	Początkowa stabilna wersja Imagen 3	Stabilny	2024-07-31	Nie wcześniej niż 31 lipca 2025 r.

Imagen 3 Fast nazwy modeli

Nazwa modelu	Opis	Etap udostępniania	Data premiery	Data przejścia na emeryturę
`imagen-3.0-fast-generate-001` ³	Początkowa stabilna wersja Imagen 3 Fast	Stabilny	2024-07-31	Nie wcześniej niż 31 lipca 2025 r.

^{3 Nie jest obsługiwane przez Gemini Developer API niezależnie od sposobu dostępu.}

Dalsze kroki

Wypróbuj możliwości Gemini API

Twórz rozmowy wieloetapowe (czat).
Generowanie tekstu na podstawie promptów zawierających tylko tekst.
Generuj tekst, podając różne typy plików, takie jak obrazy, pliki PDF, filmy i pliki audio.
Generowanie danych wyjściowych w formacie strukturalnym (np. JSON) na podstawie promptów tekstowych i multimodalnych.
Generowanie obrazów na podstawie promptów tekstowych (Gemini lub Imagen).
Przesyłanie strumieniowe danych wejściowych i wyjściowych (w tym audio) za pomocą Gemini Live API.
Używaj narzędzi (takich jak wywoływanie funkcji i uzyskiwanie podstawowych informacji z wyszukiwarki Google), aby połączyć model Gemini z innymi częściami aplikacji oraz zewnętrznymi systemami i informacjami.

Informacje o obsługiwanych modelach Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Modele ogólnego zastosowania

Gemini 3 Pro

Gemini 3 Flash

Gemini 2.5 Pro

Gemini 2.5 Flash

Gemini 2.5 Flash-Lite

Modele generujące obrazy

Gemini

Gemini 3 Pro Image (czyli nano banana pro)

Gemini 2.5 Flash Image (czyli nano banana)

Imagen

Imagen 4

Imagen 4 Fast

Imagen 4 Ultra

Modele generujące dźwięk

Gemini 2.5 Flash z natywnym dźwiękiem interfejsu Gemini Live API

Porównanie modeli

Obsługiwane wejścia i wyjścia

Obsługiwane funkcje i możliwości

Obsługiwane narzędzia

Specyfikacje i ograniczenia

Znajdowanie dodatkowych szczegółowych informacji

Wersje modeli i wzorce nazewnictwa

Dostępne nazwy modeli

Programowe wyświetlanie listy wszystkich dostępnych modeli

Gemini nazwy modeli

Gemini 3 Pro nazwy modeli

Gemini 3 Flash nazwy modeli

Gemini 3 Pro Image nazwy modeli (np. „nano banana pro”)

Gemini 2.5 Pro nazwy modeli

Gemini 2.5 Flash nazwy modeli

Gemini 2.5 Flash‑Lite nazwy modeli

Gemini 2.5 Flash Image nazwy modeli (czyli „nano banana”)

Gemini 2.5 Flash Live nazwy modeli

Imagen nazwy modeli

Imagen 4 nazwy modeli

Imagen 4 Fast nazwy modeli

Imagen 4 Ultra nazwy modeli

Imagen 3 Capability nazwy modeli

Obsługiwane języki

Gemini

Imagen

Informacje o poprzednich modelach

Gemini modelu

Imagen modelu

Modele Gemini

Gemini 2.0 Flash nazwy modeli

Gemini 2.0 Flash‑Lite nazwy modeli

Modele Imagen

Imagen 3 nazwy modeli

Imagen 3 Fast nazwy modeli

Dalsze kroki

Wypróbuj możliwości Gemini API

Informacje o obsługiwanych modelach