W przypadku aplikacji mobilnych i internetowych pakiety SDK Firebase AI Logic umożliwiają interakcję z obsługiwanymi Gemini modelami i Imagen modelami bezpośrednio z aplikacji.
Modele Gemini są uważane za wielomodalne, ponieważ potrafią przetwarzać, a nawet generować różne rodzaje danych, w tym tekst, kod, pliki PDF, obrazy, filmy i dźwięk. Imagen można poprosić o wygenerowanie obrazów na podstawie tekstu.
Poniższa tabela zawiera krótkie omówienie obsługiwanych modeli Firebase AI Logic i ich najnowszych stabilnych nazw. W tej tabeli znajdziesz też modele w wersji podglądowej i eksperymentalnej, które są dostępne do prototypowania przypadków użycia.
Zapoznaj się też z naszymi odpowiedziami na najczęstsze pytania na temat wszystkich modeli, które Firebase AI Logic obsługuje i których nie obsługuje.
Gemini modelu
Model | Dane wejściowe | Wyniki | Opis |
---|---|---|---|
Gemini modele z wersjami stabilnymi | |||
Gemini 2.5 Progemini-2.5-pro
|
tekst, kod, pliki PDF, obrazy, filmy, dźwięk; | tekst, kod, JSON | Nasz najbardziej zaawansowany model rozumujący, który potrafi rozwiązywać złożone problemy. |
Gemini 2.5 Flashgemini-2.5-flash
|
tekst, kod, pliki PDF, obrazy, filmy, dźwięk; | tekst, kod, JSON | Nasz model myślenia, który oferuje świetne, wszechstronne możliwości. Została ona zaprojektowana tak, aby zapewnić równowagę między ceną a wydajnością. |
Gemini 2.0 Flashgemini-2.0-flash-001
|
tekst, kod, pliki PDF, obrazy, filmy, dźwięk; | tekst, kod, JSON | Nasz model multimodalny z funkcjami nowej generacji i ulepszonymi możliwościami, w tym doskonałą szybkością, wbudowanym narzędziem i oknem kontekstu z milionem tokenów |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
tekst, kod, pliki PDF, obrazy, filmy, dźwięk; | tekst, kod, JSON | Nasz najszybszy i najbardziej ekonomiczny model Flash. Jest to ścieżka uaktualnienia dla użytkowników modelu 1.5 Flash, którzy chcą uzyskać lepszą jakość za tę samą cenę i przy tej samej szybkości. |
Gemini modele z wersjami tylko podglądowymi i eksperymentalnymi (zalecane tylko w przypadku prototypowania) | |||
Gemini 2.5 Flash‑Litegemini-2.5-flash-lite-preview-06-17
|
tekst, kod, pliki PDF, obrazy, filmy, dźwięk; | tekst, kod, JSON | Nasz najbardziej zrównoważony model Gemini zoptymalizowany pod kątem zastosowań wymagających krótkiego czasu oczekiwania. |
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation
|
tekst, kod, pliki PDF, obrazy, filmy, dźwięk; | obrazy, tekst i obrazy. | Nasz model multimodalny, który obsługuje dane wejściowe multimodalne i generuje obrazy. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09
|
tekst (strumieniowanie), audio (strumieniowanie) |
tekst (strumieniowanie), audio (strumieniowanie) |
Nasz model multimodalny, który obsługuje strumieniowanie w czasie rzeczywistym z niskim opóźnieniem danych wejściowych i wyjściowych w formie multimodalnej. |
1 Nie jest obsługiwane w przypadku korzystania z Gemini Developer API z pakietami SDK Firebase AI Logic.
Imagen modelu
Model | Dane wejściowe | Wyniki | Opis |
---|---|---|---|
Imagen modele z wersjami stabilnymi | |||
Imagen 3imagen-3.0-generate-002 |
tekst | obrazy | Generuje realistyczne obrazy wysokiej jakości na podstawie tekstu w języku naturalnym. |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
tekst | obrazy | Generuje obrazy na potrzeby prototypowania lub zastosowań wymagających krótkiego czasu oczekiwania |
Imagen modele z wersjami tylko podglądowymi i eksperymentalnymi (zalecane tylko w przypadku prototypowania) | |||
Imagen 4 2imagen-4.0-generate-preview-06-06
|
tekst | obrazy | Generuje realistyczne obrazy wysokiej jakości na podstawie tekstu w języku naturalnym. |
Imagen 4 Fast 2imagen-4.0-fast-generate-preview-06-06
|
tekst | obrazy | Generuje obrazy na potrzeby prototypowania lub zastosowań wymagających krótkiego czasu oczekiwania |
Imagen 4 Ultra 2imagen-4.0-ultra-generate-preview-06-06
|
tekst | obrazy | Generuje realistyczne obrazy wysokiej jakości na podstawie tekstu w języku naturalnym. |
2 Ten model Imagen nie jest obsługiwany przez Gemini Developer API niezależnie od sposobu dostępu do interfejsu API.
W dalszej części tej strony znajdziesz szczegółowe informacje o modelach obsługiwanych przez Firebase AI Logic.
-
- Obsługiwane wejścia i wyjścia
- Ogólne porównanie obsługiwanych funkcji
- Specyfikacje i ograniczenia, np. maksymalna liczba tokenów wejściowych lub maksymalna długość filmu wejściowego
Opis wersjonowania modeli, a w szczególności ich wersji stabilnych, automatycznie aktualizowanych, wersji testowych i eksperymentalnych.
Listy dostępnych nazw modeli, które można uwzględnić w kodzie podczas inicjowania.
Listy obsługiwanych języków w przypadku modeli
U dołu tej strony możesz wyświetlić szczegółowe informacje o starszych modelach.
Porównanie modeli
Każdy model ma inne możliwości, które pozwalają obsługiwać różne przypadki użycia. Pamiętaj, że każda tabela w tej sekcji opisuje poszczególne modele w przypadku użycia z Firebase AI Logic. Każdy model może mieć dodatkowe możliwości, które nie są dostępne podczas korzystania z naszych pakietów SDK.
Jeśli nie możesz znaleźć potrzebnych informacji w kolejnych podsekcjach, więcej informacji znajdziesz w dokumentacji wybranego dostawcy interfejsu API:
Obsługiwane wejścia i wyjścia
Oto obsługiwane typy danych wejściowych i wyjściowychw przypadku używania poszczególnych modeli z Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash Generowanie obrazów </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | ||
---|---|---|---|---|---|---|---|---|---|
Typy danych wejściowych | |||||||||
Tekst | |||||||||
Tekst (strumieniowanie) | |||||||||
Kod | |||||||||
Dokumenty (pliki PDF lub zwykły tekst) |
|||||||||
Obrazy | |||||||||
Wideo | |||||||||
Audio | |||||||||
Audio (streaming) | |||||||||
Typy wyjściowe | |||||||||
Tekst | |||||||||
Tekst (strumieniowanie) | |||||||||
Kod | |||||||||
Uporządkowane dane wyjściowe (np. JSON) |
|||||||||
Obrazy | |||||||||
Audio | |||||||||
Audio (streaming) |
Więcej informacji o obsługiwanych typach plików znajdziesz w artykule Obsługiwane pliki wejściowe i wymagania.
Obsługiwane funkcje
Oto obsługiwane możliwości i funkcje podczas korzystania z poszczególnych modeli z Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash Generowanie obrazów </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | |
---|---|---|---|---|---|---|---|---|
Generowanie tekstu na podstawie danych wejściowych zawierających tylko tekst lub danych multimodalnych | przeplatane lub jako część obrazu | tylko streaming | ||||||
Generowanie obrazów (Gemini lub Imagen) |
||||||||
Wygeneruj dźwięk | tylko streaming | |||||||
Generuj
dane wyjściowe w formacie strukturalnym
(np. JSON) |
||||||||
Analizowanie dokumentów
(pliki PDF lub zwykły tekst) |
||||||||
Analizowanie obrazów (wzrok) | ||||||||
Analizowanie filmu (widzenie) | ||||||||
Analizowanie dźwięku | tylko streaming | |||||||
Czat wieloetapowy | ||||||||
Wywoływanie funkcji (narzędzia) | ||||||||
Licz tokeny | ||||||||
Instrukcje systemowe | ||||||||
Dwukierunkowa transmisja multimodalna |
Specyfikacje i ograniczenia
Oto specyfikacje i ograniczenia dotyczące korzystania z poszczególnych modeli z parametrem Firebase AI Logic:
Właściwość |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash Generowanie obrazów </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen |
---|---|---|---|---|---|---|---|---|
Okno kontekstu* Łączny limit tokenów (dane wejściowe + wyjściowe) |
1 048 576 tokenów | 1 048 576 tokenów | 1 048 576 tokenów | 1 048 576 tokenów | 1 048 576 tokenów | 32 768 tokenów | 32 768 tokenów | 480 tokenów |
Limit tokenów wyjściowych* | 65 536 tokenów | 65 536 tokenów | 65 536 tokenów | 8192 tokeny | 8192 tokeny | 8192 tokeny | 8192 tokeny | --- |
Data granicy wiedzy | Styczeń 2025 r. | Styczeń 2025 r. | Styczeń 2025 r. | Czerwiec 2024 r. | Czerwiec 2024 r. | Sierpień 2024 r. | Sierpień 2024 r. | --- |
Pliki PDF (na żądanie) | ||||||||
Maksymalna liczba wejściowych plików PDF ** |
3000 plików | 3000 plików | 3000 plików | 3000 plików | 3000 plików | 3000 plików | --- | --- |
Maksymalna liczba stron w wejściowym pliku PDF ** |
1000 stron | 1000 stron | 1000 stron | 1000 stron | 1000 stron | 1000 stron | --- | --- |
Maksymalny rozmiar wejściowego pliku PDF |
50 MB | 50 MB | 50 MB | 50 MB | 50 MB | 50 MB | --- | --- |
Obrazy (z uwzględnieniem żądań) | ||||||||
Maksymalna liczba obrazów wejściowych |
3000 obrazów. | 3000 obrazów. | 3000 obrazów. | 3000 obrazów. | 3000 obrazów. | 3000 obrazów. | --- | --- |
Maksymalna liczba obrazów wyjściowych |
--- | --- | --- | --- | --- | 10 obrazów | --- | 4 obrazy |
Maksymalny rozmiar na wejściowy obraz zakodowany w formacie base64 |
7 MB | 7 MB | 7 MB | 7 MB | 7 MB | 7 MB | --- | --- |
Wideo (z uwzględnieniem żądań) | ||||||||
Maksymalna liczba plików wideo wejściowych |
10 plików | 10 plików | 10 plików | 10 plików | 10 plików | 10 plików | --- | --- |
Maksymalna długość wszystkich filmów wejściowych (tylko klatki) |
~60 minut | ~60 minut | ~60 minut | ~60 minut | ~60 minut | ~60 minut | --- | --- |
Maksymalna długość wszystkich filmów wejściowych (klatki + audio) |
~45 minut | ~45 minut | ~45 minut | ~45 minut | ~45 minut | ~45 minut | --- | --- |
Dźwięk (z uwzględnieniem żądań) | ||||||||
Maksymalna liczba wejściowych plików audio |
1 plik | 1 plik | 1 plik | 1 plik | 1 plik | 1 plik | --- | --- |
Maksymalna liczba wyjściowych plików audio |
--- | --- | --- | --- | --- | --- | --- | --- |
Maksymalna długość wszystkich wejściowych plików audio |
Ok.8,4 godziny | Ok.8,4 godziny | Ok.8,4 godziny | Ok.8,4 godziny | Ok.8,4 godziny | Ok.8,4 godziny | --- | --- |
Maksymalna długość wszystkich wyjściowych plików audio |
--- | --- | --- | --- | --- | --- | --- | --- |
*W przypadku wszystkich modeli Gemini token odpowiada około 4 znakom, więc 100 tokenów to około 60–80 słów w języku angielskim. W przypadku modeli Gemini możesz określić łączną liczbę tokenów w swoich żądaniach za pomocą countTokens
.
** Pliki PDF są traktowane jako obrazy, więc jedna strona pliku PDF jest traktowana jako jeden obraz. Liczba stron dozwolonych w żądaniu jest ograniczona do liczby obrazów, które może obsługiwać model.
Znajdowanie dodatkowych szczegółowych informacji
Limity i ceny są różne w przypadku poszczególnych modeli. Ceny zależą też od danych wejściowych i wyjściowych.
Więcej informacji o obsługiwanych typach plików wejściowych, sposobie określania typu MIME oraz o tym, jak zadbać o to, aby pliki wejściowe i żądania multimodalne spełniały wymagania i były zgodne ze sprawdzonymi metodami, znajdziesz w artykule Obsługiwane pliki wejściowe i wymagania.
Wersje modeli i wzorce nazewnictwa
Modele są dostępne w wersjach stabilnej, testowej i eksperymentalnej. Dla wygody obsługiwane są aliasy bez jawnych wartości wersji.
Aby znaleźć konkretne nazwy modeli do użycia w kodzie, zapoznaj się z sekcją „Dostępne nazwy modeli” poniżej.
Typ wersji / Etap publikacji |
Opis | Wzorzec nazwy modelu | |
---|---|---|---|
Stabilna |
Stabilne wersje są dostępne i obsługiwane w środowisku produkcyjnym od daty premiery.
Stabilna wersja modelu jest zwykle udostępniana z datą wycofania, która oznacza ostatni dzień, w którym model jest dostępny. Po tej dacie model nie będzie już dostępny ani obsługiwany przez Google. |
|
|
Automatycznie aktualizowany alias wersji stabilnej (tylko modele Gemini 2.0) |
Automatycznie aktualizowane stabilne aliasy zawsze wskazują najnowszą stabilną wersję danego modelu. Jeśli zostanie opublikowana nowa wersja stabilna, alias automatycznie aktualizowany zacznie automatycznie wskazywać tę nową wersję stabilną. |
Gemini 2.0 tylko modele
Przykład: |
|
Podgląd |
Wersje przedpremierowe mają nowe funkcje i są uważane za niestabilne.
Te modele nie są zalecane do użytku w środowisku produkcyjnym, mają bardziej restrykcyjne limity żądań i mogą podlegać wymaganiom dotyczącym płatności.
W przypadku Vertex AI Gemini API modele w wersji podglądowej wydane po czerwcu 2025 r. zwykle wymagają ustawienia lokalizacji modelu na |
Nazwy modeli wersji podglądowych są uzupełniane o
Przykład: |
|
Eksperymentalne |
Wersje eksperymentalne mają nowe funkcje i są uważane za niestabilne.
Te modele nie są zalecane do użytku w środowisku produkcyjnym i mają bardziej restrykcyjne limity żądań. Modele eksperymentalne służą do zbierania opinii i umożliwiają testowanie naszych najnowszych funkcji. W przypadku Vertex AI Gemini API modele eksperymentalne wydane po czerwcu 2025 r. wymagają ustawienia lokalizacji modelu na |
Nazwy modeli wersji eksperymentalnych są uzupełniane o
Przykład: |
|
Jestem na emeryturze |
Wersje wycofane są po dacie wycofania i zostały trwale wyłączone.
Wycofane modele nie są już dostępne ani obsługiwane przez Google, a żądania odwołujące się do identyfikatora wycofanego modelu zwykle zwracają błąd 404. |
--- |
Dostępne nazwy modeli
Nazwy modeli to konkretne wartości, które umieszczasz w kodzie podczas inicjowania modelu.
Programowe wyświetlanie listy wszystkich dostępnych modeli
Za pomocą interfejsu API REST możesz wyświetlić listę wszystkich dostępnych nazw modeli:
Gemini Developer API: Wywołaj
models.list
punkt końcowyVertex AI Gemini API: Wywołaj
publishers.models.list
punkt końcowy
Pamiętaj, że zwrócona lista będzie zawierać wszystkie modele obsługiwane przez dostawców interfejsów API, ale Firebase AI Logic obsługuje tylko modele Gemini i Imagen opisane na tej stronie.
Pamiętaj też, że automatycznie aktualizowane aliasy (np. gemini-2.0-flash
) nie są wymienione, ponieważ są aliasami ułatwiającymi korzystanie z modelu podstawowego.
Gemini nazwy modeli
Przykłady inicjowania na Twojej platformie znajdziesz w przewodniku dla początkujących.
Szczegółowe informacje o etapach udostępniania (zwłaszcza przypadki użycia i rozliczenia) znajdziesz w artykule Wersje modeli i wzorce nazewnictwa.
Gemini 2.5 Pro nazwy modeli
Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
gemini-2.5-pro |
Najnowsza stabilna wersja Gemini 2.5 Pro | Stabilny | 2025-06-17 | Nie wcześniej niż 17 czerwca 2026 r. |
gemini-2.5-pro-preview-06-05 |
Wersja podglądowa wskazująca najnowszą stabilną wersję
Gemini 2.5 Pro (obecnie gemini-2.5-pro |
Podgląd | 2025-06-05 | Nie wcześniej niż 15 lipca 2025 r. |
gemini-2.5-pro-preview-05-06 |
Wersja testowa wskazująca najnowszą stabilną wersjęGemini 2.5 Pro* (obecnie gemini-2.5-pro |
Podgląd | 2025-05-06 | Nie wcześniej niż 15 lipca 2025 r. |
gemini-2.5-pro-preview-03-25 |
Wersja testowa wskazująca najnowszą stabilną wersjęGemini 2.5 Pro* (obecnie gemini-2.5-pro |
Podgląd | 2025-03-25 | Nie wcześniej niż 15 lipca 2025 r. |
* Obecne wersje podglądowe modeli Gemini 2.5 Pro zaczną wskazywać wersję stabilną 19 czerwca 2025 r.
Gemini 2.5 Flash nazwy modeli
Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
gemini-2.5-flash |
Najnowsza stabilna wersja Gemini 2.5 Flash | Stabilny | 2025-06-17 | Nie wcześniej niż 17 czerwca 2026 r. |
gemini-2.5-flash-preview-05-20 |
Wersja podglądowa wskazująca najnowszą stabilną wersję
Gemini 2.5 Flash (obecnie gemini-2.5-flash |
Podgląd | 2025-05-20 | Nie wcześniej niż 15 lipca 2025 r. |
gemini-2.5-flash-preview-04-17 |
Wersja testowa wskazująca najnowszą stabilną wersjęGemini 2.5 Flash* (obecnie gemini-2.5-flash |
Podgląd | 2025-04-17 | Nie wcześniej niż 15 lipca 2025 r. |
* Obecne wersje podglądowe modeli Gemini 2.5 Flash zaczną wskazywać wersję stabilną 19 czerwca 2025 r.
Gemini 2.5 Flash‑Lite nazwy modeli
Gemini 2.5Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
gemini-2.5-flash-lite-preview-06-17 |
Wersja podglądowa Gemini 2.5 Flash‑Lite | Podgląd | 2025-06-17 | Jeszcze nieznany |
Gemini 2.0 Flash nazwy modeli
Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
gemini-2.0-flash-001 |
Najnowsza stabilna wersja Gemini 2.0 Flash | Stabilny | 2025-02-05 | Nie wcześniej niż 2026-02-05 |
gemini-2.0-flash |
Automatycznie aktualizowany alias wskazujący najnowszą stabilną wersję
Gemini 2.0 Flash (obecnie gemini-2.0-flash-001 |
Stabilny | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite nazwy modeli
Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Najnowsza stabilna wersja Gemini 2.0 Flash‑Lite | Stabilny | 2025-02-25 | Nie wcześniej niż 2026-02-25 |
gemini-2.0-flash-lite |
Automatycznie aktualizowany alias wskazujący najnowszą stabilną wersję
Gemini 2.0 Flash‑Lite (obecnie gemini-2.0-flash-lite-001 |
Stabilny | 2025-02-25 | --- |
Gemini 2.0 Flash Image Generation nazwy modeli
Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation 1 |
Wersja podglądu: Gemini 2.0 Flash Image Generation | Podgląd | 2025-05-06 | Jeszcze nieznany |
Gemini 2.0 Flash Live nazwy modeli
Dostępne tylko wtedy, gdy jako dostawcę interfejsu API używasz Vertex AI Gemini API. |
Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Wersja podglądu: Gemini 2.0 Flash Live | Podgląd | 2025-04-09 | Jeszcze nieznany |
1 Nie jest obsługiwane w przypadku korzystania z Gemini Developer API z pakietami SDK Firebase AI Logic.
Imagen nazwy modeli
Przykłady inicjowania na Twojej platformie znajdziesz w przewodniku generowania obrazów za pomocą Imagen.
Szczegółowe informacje o etapach udostępniania (zwłaszcza przypadki użycia i rozliczenia) znajdziesz w artykule Wersje modeli i wzorce nazewnictwa.
Imagen 4 nazwy modeli
Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
imagen-4.0-generate-preview-06-06 2 |
Wersja podglądowa: Imagen 4 | Podgląd | 2025-06-06 | Jeszcze nieznany |
imagen-4.0-generate-preview-05-20 2 |
Wersja podglądowa: Imagen 4 | Podgląd | 2025-05-20 | Nie wcześniej niż 7 lipca 2025 r. |
Imagen 4 Fast nazwy modeli
Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
imagen-4.0-fast-generate-preview-06-06 2 |
Wersja podglądowa: Imagen 4 Fast | Podgląd | 2025-06-06 | Jeszcze nieznany |
Imagen 4 Ultra nazwy modeli
Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
imagen-4.0-ultra-generate-preview-06-06 2 |
Wersja podglądowa: Imagen 4 Ultra | Podgląd | 2025-06-06 | Jeszcze nieznany |
imagen-4.0-ultra-generate-exp-05-20 2 |
Eksperymentalna wersja Imagen 4 Ultra | Wersja eksperymentalna | 2025-05-20 | Nie wcześniej niż 7 lipca 2025 r. |
Imagen 3 nazwy modeli
Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
imagen-3.0-generate-002 |
Najnowsza stabilna wersja Imagen 3 | Stabilny | 2025-01-23 | Nie wcześniej niż 23.01.2026 |
imagen-3.0-generate-001 2 |
Początkowa stabilna wersja Imagen 3 | Stabilny | 2024-07-31 | Nie wcześniej niż 31 lipca 2025 r. |
Imagen 3 Fast nazwy modeli
Nazwa modelu | Opis | Etap udostępniania | Data premiery | Data wycofania |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Początkowa stabilna wersja Imagen 3 Fast | Stabilny | 2024-07-31 | Nie wcześniej niż 31 lipca 2025 r. |
2 Nie jest obsługiwane przez Gemini Developer API niezależnie od sposobu dostępu do interfejsu API.
Obsługiwane języki
Gemini
Wszystkie modele Gemini rozumieją te języki i mogą w nich odpowiadać:
arabski (ar), bengalski (bn), bułgarski (bg), chiński uproszczony i tradycyjny (zh), chorwacki (hr), czeski (cs), duński (da), angielski (en), estoński (et), fiński (fi), francuski (fr), grecki (el), hebrajski (iw), hindi (hi), hiszpański (es), indonezyjski (id), japoński (ja), koreański (ko), litewski (lt), łotewski (lv), niemiecki (de), norweski (no), polski (pl), portugalski (pt), rosyjski (ru), rumuński (ro), serbski (sr), słowacki (sk), słoweński (sl), suahili (sw), szwedzki (sv), tajski (th), turecki (tr), ukraiński (uk), węgierski (hu), wietnamski (vi), włoski (it)
Modele Gemini 2.0 Flash, Gemini 1.5 Pro i Gemini 1.5 Flash rozumieją i mogą odpowiadać w tych dodatkowych językach:
afrikaans (af), amharski (am), asamski (as), azerbejdżański (az), białoruski (be), bośniacki (bs), kataloński (ca), cebuański (ceb), korsykański (co), walijski (cy), malediwski (dv), esperanto (eo), baskijski (eu), perski (fa), filipiński (tagalski) (fil), fryzyjski (fy), irlandzki (ga), szkocki gaelicki (gd), galicyjski (gl), gudżarati (gu), hausa (ha), hawajski (haw), hmong (hmn), kreolski haitański (ht), ormiański (hy), igbo (ig), islandzki (is), jawajski (jv), gruziński (ka), kazachski (kk), khmerski (km), kannada (kn), krio (kri), kurdyjski (ku), kirgiski (ky), łaciński (la), luksemburski (lb), laotański (lo), malgaski (mg), maoryski (mi), macedoński (mk), malajalam (ml), mongolski (mn), meitei (manipuri) (mni-Mtei), marathi (mr), malajski (ms), maltański (mt), birmański (my), nepalski (ne), nyanja (chichewa) (ny), odia (or), pendżabski (pa), paszto (ps), sindhi (sd), syngaleski (si), samoański (sm), shona (sn), somalijski (so), albański (sq), sotho (st), sundajski (su), tamilski (ta), telugu (te), tadżycki (tg), ujgurski (ug), urdu (ur), uzbecki (uz), xhosa (xh), jidysz (yi), joruba (yo), zulu (zu)
Imagen
Ogólna dostępność: język angielski
Podgląd: chiński (uproszczony), chiński (tradycyjny), hiszpański, japoński, koreański, hindi, portugalski.
Informacje o starszych modelach
Firebase AI Logic obsługuje starsze aktywne modele Gemini (np. modele Gemini 1.5).
Firebase AI Logic nie obsługuje starszych modeli Imagen (np. Imagen 2).
Model | Dane wejściowe | Wyniki | Zoptymalizowany dla |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
tekst, kod, pliki PDF, obrazy, filmy, dźwięk; | tekst, kod, JSON | Obsługuje złożone zadania wymagające większej inteligencji; długi kontekst o wielkości 2 mln tokenów |
Gemini 1.5 Flashgemini-1.5-flash-002 |
tekst, kod, pliki PDF, obrazy, filmy, dźwięk; | tekst, kod, JSON | Zapewnia szybkie i wszechstronne działanie w różnych zadaniach. |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
Dalsze kroki
Wypróbuj możliwości Gemini API
- Twórz rozmowy wieloetapowe (czat).
- generować tekst na podstawie promptów tekstowych,
- Generuj tekst, podając różne typy plików, np. obrazy, pliki PDF, filmy i pliki audio.
- Generowanie danych wyjściowych o strukturze (np. JSON) na podstawie promptów tekstowych i multimodalnych.
- Generuj obrazy na podstawie promptów tekstowych (Gemini lub Imagen).
- Przesyłanie strumieniowe danych wejściowych i wyjściowych (w tym audio) za pomocą Gemini Live API.
- Używaj wywoływania funkcji, aby łączyć modele generatywne z systemami zewnętrznymi i informacjami.