Mit den Firebase AI Logic-SDKs für mobile Apps und Web-Apps können Sie direkt aus Ihrer App mit den unterstützten Gemini-Modellen und Imagen-Modellen interagieren.
Gemini-Modelle gelten als multimodal, da sie in der Lage sind, mehrere Modalitäten zu verarbeiten und sogar zu generieren, darunter Text, Code, PDFs, Bilder, Videos und Audio. Imagen-Modelle können mit Text-Prompts aufgefordert werden, Bilder zu generieren.
Die folgende Tabelle bietet einen kurzen Überblick über die unterstützten Modelle für Firebase AI Logic und ihre neuesten stabilen Modellnamen. In dieser Tabelle sind auch Preview- und experimentelle Modelle aufgeführt, die für Prototyping-Anwendungsfälle verfügbar sind.
Sehen Sie sich auch unsere FAQs zu allen Modellen an, die von Firebase AI Logic unterstützt werden und nicht unterstützt werden.
Gemini Modelle
Modell | Eingabe | Ausgabe | Beschreibung |
---|---|---|---|
Gemini-Modelle mit stabilen Versionen | |||
Gemini 2.5 Progemini-2.5-pro
|
Text, Code, PDFs, Bilder, Videos, Audio | Text, Code, JSON | Unser fortschrittlichstes Logikmodell, das komplexe Probleme lösen kann. |
Gemini 2.5 Flashgemini-2.5-flash
|
Text, Code, PDFs, Bilder, Videos, Audio | Text, Code, JSON | Unser Thinking-Modell bietet umfassende Funktionen. Sie bieten ein ausgewogenes Preis-Leistungs-Verhältnis. |
Gemini 2.0 Flashgemini-2.0-flash-001
|
Text, Code, PDFs, Bilder, Videos, Audio | Text, Code, JSON | Unser multimodales Modell mit Funktionen der nächsten Generation und verbesserten Funktionen, einschließlich hervorragender Geschwindigkeit, integrierter Tool-Nutzung und einem Kontextfenster von 1 Million Tokens |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
Text, Code, PDFs, Bilder, Videos, Audio | Text, Code, JSON | Unser schnellstes und kostengünstigstes Flash-Modell. Es ist ein Upgrade für Nutzer von 1.5 Flash, die für denselben Preis und dieselbe Geschwindigkeit eine bessere Qualität wünschen. |
Gemini-Modelle mit nur Vorschau- und Testversionen (nur für Prototyping-Anwendungsfälle empfohlen) | |||
Gemini 2.5 Flash‑Litegemini-2.5-flash-lite-preview-06-17
|
Text, Code, PDFs, Bilder, Videos, Audio | Text, Code, JSON | Unser ausgewogenstes Gemini-Modell, optimiert für latenzarme Anwendungsfälle. |
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation
|
Text, Code, PDFs, Bilder, Videos, Audio | Bilder, Text und Bilder | Unser multimodales Modell, das multimodale Eingaben und Bildausgaben unterstützt. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09
|
Text (Streaming), Audio (Streaming) |
Text (Streaming), Audio (Streaming) |
Unser multimodales Modell, das latenzarmes Echtzeit-Streaming von multimodalen Ein- und Ausgaben unterstützt. |
1 Wird nicht unterstützt, wenn das Gemini Developer API mit Firebase AI Logic-SDKs verwendet wird.
Imagen Modelle
Modell | Eingabe | Ausgabe | Beschreibung |
---|---|---|---|
Imagen-Modelle mit stabilen Versionen | |||
Imagen 3imagen-3.0-generate-002 |
Text | Bilder | Generiert realistische, hochwertige Bilder aus Text-Prompts in natürlicher Sprache |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
Text | Bilder | Generiert Bilder für Prototypen oder Anwendungsfälle mit niedriger Latenz |
Imagen-Modelle mit nur Vorschau- und Testversionen (nur für Prototyping-Anwendungsfälle empfohlen) | |||
Imagen 4 2imagen-4.0-generate-preview-06-06
|
Text | Bilder | Generiert realistische, hochwertige Bilder aus Text-Prompts in natürlicher Sprache |
Imagen 4 Fast 2imagen-4.0-fast-generate-preview-06-06
|
Text | Bilder | Generiert Bilder für Prototypen oder Anwendungsfälle mit niedriger Latenz |
Imagen 4 Ultra 2imagen-4.0-ultra-generate-preview-06-06
|
Text | Bilder | Generiert realistische, hochwertige Bilder aus Text-Prompts in natürlicher Sprache |
2 Dieses Imagen-Modell wird von der Gemini Developer API nicht unterstützt, unabhängig davon, wie Sie auf die API zugreifen.
Auf dem Rest dieser Seite finden Sie detaillierte Informationen zu den von Firebase AI Logic unterstützten Modellen.
-
- Unterstützte Ein- und Ausgaben
- Vergleich der unterstützten Funktionen
- Spezifikationen und Einschränkungen, z. B. maximale Anzahl von Eingabetokens oder maximale Länge des Eingabevideos
Beschreibung der Versionsverwaltung von Modellen, insbesondere der Versionen stabil, automatisch aktualisiert, Vorschau und experimentell
Listen mit verfügbaren Modellnamen, die bei der Initialisierung in Ihren Code aufgenommen werden sollen.
Listen der unterstützten Sprachen für die Modelle
Unten auf dieser Seite finden Sie detaillierte Informationen zu älteren Modellen.
Modelle vergleichen
Jedes Modell hat unterschiedliche Funktionen für verschiedene Anwendungsfälle. In den Tabellen in diesem Abschnitt wird jedes Modell in Kombination mit Firebase AI Logic beschrieben. Jedes Modell kann zusätzliche Funktionen haben, die bei Verwendung unserer SDKs nicht verfügbar sind.
Wenn Sie in den folgenden Unterabschnitten nicht die gewünschten Informationen finden, können Sie in der Dokumentation des von Ihnen ausgewählten API-Anbieters nachsehen:
Gemini Developer API: Gemini-Modelle und Imagen-Modelle
Vertex AI Gemini API: Gemini-Modelle und Imagen-Modelle
Unterstützte Ein- und Ausgaben
Dies sind die unterstützten Ein- und Ausgabetypen bei der Verwendung der einzelnen Modelle mit Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash Image Generation </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | ||
---|---|---|---|---|---|---|---|---|---|
Eingabetypen | |||||||||
Text | |||||||||
Text (Streaming) | |||||||||
Code | |||||||||
Dokumente (PDFs oder Nur-Text) |
|||||||||
Bilder | |||||||||
Video | |||||||||
Audio | |||||||||
Audio (Streaming) | |||||||||
Ausgabetypen | |||||||||
Text | |||||||||
Text (Streaming) | |||||||||
Code | |||||||||
Strukturierte Ausgabe (z. B. JSON) |
|||||||||
Bilder | |||||||||
Audio | |||||||||
Audio (Streaming) |
Informationen zu unterstützten Dateitypen finden Sie unter Unterstützte Eingabedateien und Anforderungen.
Unterstützte Funktionen
Das sind die unterstützten Funktionen und Features bei der Verwendung der einzelnen Modelle mit Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash Image Generation </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | |
---|---|---|---|---|---|---|---|---|
Text generieren aus Nur-Text- oder multimodalen Eingaben | verschachtelt oder als Teil des Bildes | Nur Streaming | ||||||
Bilder generieren (Gemini oder Imagen) |
||||||||
Audio generieren | Nur Streaming | |||||||
Strukturierte Ausgabe generieren
(z. B. JSON) |
||||||||
Dokumente analysieren
(PDFs oder Nur-Text) |
||||||||
Bilder analysieren (Vision) | ||||||||
Video analysieren (Vision) | ||||||||
Audio analysieren | Nur Streaming | |||||||
Wechselseitiger Chat | ||||||||
Funktionsaufrufe (Tools) | ||||||||
Tokens zählen | ||||||||
Systemanweisungen | ||||||||
Bidirektionales multimodales Streaming |
Spezifikationen und Einschränkungen
Hier finden Sie die Spezifikationen und Einschränkungen für die Verwendung der einzelnen Modelle mit Firebase AI Logic:
Attribut |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash Image Generation </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen |
---|---|---|---|---|---|---|---|---|
Kontextfenster * Gesamttokenlimit (kombinierte Eingabe und Ausgabe) |
1.048.576 Tokens | 1.048.576 Tokens | 1.048.576 Tokens | 1.048.576 Tokens | 1.048.576 Tokens | 32.768 Tokens | 32.768 Tokens | 480 Tokens |
Tokenausgabelimit* | 65.536 Tokens | 65.536 Tokens | 65.536 Tokens | 8.192 Tokens | 8.192 Tokens | 8.192 Tokens | 8.192 Tokens | --- |
Wissensstichtag | Januar 2025 | Januar 2025 | Januar 2025 | Juni 2024 | Juni 2024 | August 2024 | August 2024 | --- |
PDFs (auf Anfrage) | ||||||||
Maximale Anzahl von PDF-Eingabedateien ** |
3.000 Dateien | 3.000 Dateien | 3.000 Dateien | 3.000 Dateien | 3.000 Dateien | 3.000 Dateien | --- | --- |
Maximale Anzahl von Seiten pro PDF-Eingabedatei** |
1.000 Seiten | 1.000 Seiten | 1.000 Seiten | 1.000 Seiten | 1.000 Seiten | 1.000 Seiten | --- | --- |
Maximale Größe pro PDF-Eingabedatei |
50 MB | 50 MB | 50 MB | 50 MB | 50 MB | 50 MB | --- | --- |
Bilder (pro Anfrage) | ||||||||
Maximale Anzahl von Eingabebildern |
3.000 Bilder | 3.000 Bilder | 3.000 Bilder | 3.000 Bilder | 3.000 Bilder | 3.000 Bilder | --- | --- |
Maximale Anzahl von Ausgabebildern |
--- | --- | --- | --- | --- | 10 Bilder | --- | 4 Bilder |
Maximale Größe pro base64-codiertem Eingabebild |
7 MB | 7 MB | 7 MB | 7 MB | 7 MB | 7 MB | --- | --- |
Video (auf Anfrage) | ||||||||
Maximale Anzahl von Eingabevideodateien |
10 Dateien | 10 Dateien | 10 Dateien | 10 Dateien | 10 Dateien | 10 Dateien | --- | --- |
Maximale Länge aller Eingabevideos (nur Frames) |
~ 60 Minuten | ~ 60 Minuten | ~ 60 Minuten | ~ 60 Minuten | ~ 60 Minuten | ~ 60 Minuten | --- | --- |
Maximale Länge aller Eingabevideos (Bilder + Audio) |
~ 45 Minuten | ~ 45 Minuten | ~ 45 Minuten | ~ 45 Minuten | ~ 45 Minuten | ~ 45 Minuten | --- | --- |
Audio (pro Anfrage) | ||||||||
Maximale Anzahl von Eingabe-Audiodateien |
1 Datei | 1 Datei | 1 Datei | 1 Datei | 1 Datei | 1 Datei | --- | --- |
Maximale Anzahl von Ausgabe-Audiodateien |
--- | --- | --- | --- | --- | --- | --- | --- |
Maximale Länge aller Eingabe-Audiodateien |
~ 8,4 Stunden | ~ 8,4 Stunden | ~ 8,4 Stunden | ~ 8,4 Stunden | ~ 8,4 Stunden | ~ 8,4 Stunden | --- | --- |
Maximale Länge aller Ausgabe-Audiodateien |
--- | --- | --- | --- | --- | --- | --- | --- |
*
Bei allen Gemini-Modellen entspricht ein Token etwa vier Zeichen. 100 Tokens entsprechen also etwa 60–80 Wörtern. Bei Gemini-Modellen können Sie die Gesamtzahl der Tokens in Ihren Anfragen mit countTokens
ermitteln.
** PDFs werden als Bilder behandelt, sodass eine einzelne Seite einer PDF-Datei als ein Bild behandelt wird. Die Anzahl der Seiten in einer Anfrage ist auf die Anzahl der Bilder beschränkt, die das Modell unterstützen kann.
Weitere detaillierte Informationen finden
Kontingente und Preise sind für jedes Modell unterschiedlich. Die Preise hängen auch von der Eingabe und Ausgabe ab.
Informationen zu unterstützten Eingabedateitypen, zum Angeben des MIME-Typs und dazu, wie Sie dafür sorgen, dass Ihre Eingabedateien und multimodalen Anfragen den Anforderungen entsprechen und die Best Practices in Unterstützte Eingabedateien und Anforderungen eingehalten werden.
Modellversionsverwaltung und Benennungsmuster
Modelle werden in stabilen, Vorschau- und experimentellen Versionen angeboten. Zur Vereinfachung werden Aliase ohne explizite Versionswerte unterstützt.
Im Abschnitt Verfügbare Modellnamen weiter unten auf dieser Seite finden Sie bestimmte Modellnamen, die Sie in Ihrem Code verwenden können.
Versionstyp / Releasestufe |
Beschreibung | Muster für Modellnamen | |
---|---|---|---|
Stabil |
Stabile Versionen sind ab dem Veröffentlichungsdatum für die Produktion verfügbar und werden unterstützt.
Eine stabile Modellversion wird in der Regel mit einem Ablaufdatum veröffentlicht, das den letzten Tag angibt, an dem das Modell verfügbar ist. Nach diesem Datum ist das Modell nicht mehr zugänglich und wird nicht mehr von Google unterstützt. |
|
|
Automatisch aktualisierter stabiler Alias (nur Gemini 2.0-Modelle) |
Automatisch aktualisierte stabile Aliase verweisen immer auf die neueste stabile Version des jeweiligen Modells. Wenn eine neue stabile Version veröffentlicht wird, verweist der Alias auto-updated automatisch auf diese neue stabile Version. |
Nur Gemini 2.0-Modelle
Beispiel: |
|
Vorschau |
Vorschauversionen haben neue Funktionen und gelten als nicht stabil.
Diese Modelle werden nicht für die Produktion empfohlen, haben restriktivere Ratenlimits und unterliegen möglicherweise Abrechnungsanforderungen.
Für die Vertex AI Gemini API müssen Sie bei Preview-Modellen, die nach Juni 2025 veröffentlicht wurden, in der Regel den Standort des Modells auf |
An die Modellnamen von Vorschauversionen wird
Beispiel: |
|
Experimentell |
Experimentelle Versionen haben neue Funktionen und gelten als nicht stabil.
Diese Modelle werden nicht für die Produktion empfohlen und haben restriktivere Ratenlimits. Experimentelle Modelle sind dazu gedacht, Feedback zu sammeln und unsere neuesten Funktionen zu testen. Für die Vertex AI Gemini API müssen Sie bei experimentellen Modellen, die nach Juni 2025 veröffentlicht werden, den Standort des Modells auf |
An die Modellnamen von experimentellen Versionen wird
Beispiel: |
|
Rentner |
Eingestellte Versionen sind nach dem Einstellungsdatum endgültig deaktiviert.
Auf eingestellte Modelle kann nicht mehr zugegriffen werden und sie werden nicht mehr von Google unterstützt. Anfragen, die auf eine eingestellte Modell-ID verweisen, geben in der Regel einen 404-Fehler zurück. |
--- |
Verfügbare Modellnamen
Modellnamen sind die expliziten Werte, die Sie in Ihren Code bei der Initialisierung des Modells einfügen.
Alle verfügbaren Modelle programmatisch auflisten
Sie können alle verfügbaren Modellnamen mit der REST API auflisten:
Gemini Developer API: Ruft den Endpunkt
models.list
auf.Vertex AI Gemini API: Ruft den Endpunkt
publishers.models.list
auf.
Die zurückgegebene Liste enthält alle von den API-Anbietern unterstützten Modelle. Firebase AI Logic unterstützt jedoch nur die auf dieser Seite beschriebenen Modelle Gemini und Imagen.
Automatisch aktualisierte Aliase (z. B. gemini-2.0-flash
) werden nicht aufgeführt, da sie ein Alias für das Basismodell sind.
Gemini Modellnamen
Beispiele für die Initialisierung für Ihre Plattform finden Sie im Startleitfaden.
Weitere Informationen zu den Releasephasen (insbesondere zu Anwendungsfällen und Abrechnung) finden Sie unter Modellversionierung und Benennungsmuster.
Gemini 2.5 Pro Modellnamen
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
gemini-2.5-pro |
Neueste stabile Version von Gemini 2.5 Pro | Stabil | 2025-06-17 | Frühestens am 2026-06-17 |
gemini-2.5-pro-preview-06-05 |
Vorschauversion, die auf die neueste stabile Version von
Gemini 2.5 Pro (derzeit gemini-2.5-pro |
Vorschau | 2025-06-05 | Frühestens am 2025-07-15 |
gemini-2.5-pro-preview-05-06 |
Vorschauversion, die auf die neueste stabile Version von
Gemini 2.5 Pro* (derzeit gemini-2.5-pro |
Vorschau | 2025-05-06 | Frühestens am 2025-07-15 |
gemini-2.5-pro-preview-03-25 |
Vorschauversion, die auf die neueste stabile Version von
Gemini 2.5 Pro* (derzeit gemini-2.5-pro |
Vorschau | 25.03.2025 | Frühestens am 2025-07-15 |
* Vorhandene Vorschauversionen von Gemini 2.5 Pro-Modellen werden ab dem 19. Juni 2025 auf die stabile Version verweisen.
Gemini 2.5 Flash Modellnamen
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
gemini-2.5-flash |
Neueste stabile Version von Gemini 2.5 Flash | Stabil | 2025-06-17 | Frühestens am 2026-06-17 |
gemini-2.5-flash-preview-05-20 |
Vorschauversion, die auf die neueste stabile Version von
Gemini 2.5 Flash (derzeit gemini-2.5-flash |
Vorschau | 2025-05-20 | Frühestens am 2025-07-15 |
gemini-2.5-flash-preview-04-17 |
Vorschauversion, die auf die neueste stabile Version von
Gemini 2.5 Flash* (derzeit gemini-2.5-flash |
Vorschau | 2025-04-17 | Frühestens am 2025-07-15 |
* Vorhandene Vorschauversionen von Gemini 2.5 Flash-Modellen werden ab dem 19. Juni 2025 auf die stabile Version verweisen.
Gemini 2.5 Flash‑Lite Modellnamen
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
gemini-2.5-flash-lite-preview-06-17 |
Erste Vorschauversion von Gemini 2.5 Flash‑Lite | Vorschau | 2025-06-17 | Noch nicht bekannt |
Gemini 2.0 Flash Modellnamen
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
gemini-2.0-flash-001 |
Neueste stabile Version von Gemini 2.0 Flash | Stabil | 2025-02-05 | Frühestens am 2026-02-05 |
gemini-2.0-flash |
Automatisch aktualisierter Alias, der auf die neueste stabile Version von Gemini 2.0 Flash verweist (derzeit gemini-2.0-flash-001 |
Stabil | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite Modellnamen
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Neueste stabile Version von Gemini 2.0 Flash‑Lite | Stabil | 2025-02-25 | Frühestens am 2026-02-25 |
gemini-2.0-flash-lite |
Automatisch aktualisierter Alias, der auf die neueste stabile Version von Gemini 2.0 Flash‑Lite verweist (derzeit gemini-2.0-flash-lite-001 |
Stabil | 2025-02-25 | --- |
Gemini 2.0 Flash Image Generation Modellnamen
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation 1 |
Vorschauversion für Gemini 2.0 Flash Image Generation | Vorschau | 2025-05-06 | Noch nicht bekannt |
Gemini 2.0 Flash Live Modellnamen
Nur verfügbar, wenn Sie Vertex AI Gemini API als API-Anbieter verwenden. |
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Vorschauversion für Gemini 2.0 Flash Live | Vorschau | 2025-04-09 | Noch nicht bekannt |
1 Wird nicht unterstützt, wenn das Gemini Developer API mit Firebase AI Logic-SDKs verwendet wird.
Imagen Modellnamen
Beispiele für die Initialisierung für Ihre Plattform finden Sie im Leitfaden zum Generieren von Bildern mit Imagen.
Weitere Informationen zu den Releasephasen (insbesondere zu Anwendungsfällen und Abrechnung) finden Sie unter Modellversionierung und Benennungsmuster.
Imagen 4 Modellnamen
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
imagen-4.0-generate-preview-06-06 2 |
Vorschauversion von Imagen 4 | Vorschau | 2025-06-06 | Noch nicht bekannt |
imagen-4.0-generate-preview-05-20 2 |
Vorschauversion von Imagen 4 | Vorschau | 2025-05-20 | Frühestens am 07.07.2025 |
Imagen 4 Fast Modellnamen
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
imagen-4.0-fast-generate-preview-06-06 2 |
Vorschauversion von Imagen 4 Fast | Vorschau | 2025-06-06 | Noch nicht bekannt |
Imagen 4 Ultra Modellnamen
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
imagen-4.0-ultra-generate-preview-06-06 2 |
Vorschauversion von Imagen 4 Ultra | Vorschau | 2025-06-06 | Noch nicht bekannt |
imagen-4.0-ultra-generate-exp-05-20 2 |
Testversion von Imagen 4 Ultra | Experimentell | 2025-05-20 | Frühestens am 07.07.2025 |
Imagen 3 Modellnamen
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
imagen-3.0-generate-002 |
Neueste stabile Version von Imagen 3 | Stabil | 2025-01-23 | Frühestens am 23.01.2026 |
imagen-3.0-generate-001 2 |
Erste stabile Version von Imagen 3 | Stabil | 2024-07-31 | Frühestens am 31.07.2025 |
Imagen 3 Fast Modellnamen
Modellname | Beschreibung | Releasestufe | Veröffentlicht | Einstellungsdatum |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Erste stabile Version von Imagen 3 Fast | Stabil | 2024-07-31 | Frühestens am 31.07.2025 |
2 Wird von der Gemini Developer API nicht unterstützt, unabhängig davon, wie Sie auf die API zugreifen.
Unterstützte Sprachen
Gemini
Alle Gemini-Modelle können die folgenden Sprachen verstehen und darauf antworten:
Arabisch (ar), Bengalisch (bn), Bulgarisch (bg), Chinesisch (vereinfacht und traditionell), Kroatisch (hr), Tschechisch (cs), Dänisch (da), Niederländisch (nl), Englisch (en), Estnisch (et), Finnisch (fi), Französisch (fr), Deutsch (de), Griechisch (el), Hebräisch (iw), Hindi (hi), Ungarisch (hu), Indonesisch (id), Italienisch (it), Japanisch (ja), Koreanisch (ko), Lettisch (lv), Litauisch (lt), Norwegisch (no) ), Polnisch (pl), Portugiesisch (pt), Rumänisch (ro), Russisch (ru), Serbisch (sr), Slowakisch (sk), Slowenisch (sl), Spanisch (es), Swahili (sw), Schwedisch (sv), Thai (th), Türkisch (tr), Ukrainisch (uk), Vietnamesisch (vi).
Die Modelle Gemini 2.0 Flash, Gemini 1.5 Pro und Gemini 1.5 Flash können die folgenden zusätzlichen Sprachen verstehen und darauf antworten:
Afrikaans (af), Amharisch (am), Assamesisch (as), Aserbaidschanisch (az), Weißrussisch (be), Bosnisch (bs), Katalanisch (ca), Cebuano (ceb), Korsisch (co), Walisisch (cy), Divehi (dv), Esperanto (eo), Baskisch (eu), Persisch (fa), Filipino (Tagalog) (fil), Friesisch (fy), Irisch (ga), Schottisch-Gälisch (gd), Galicisch (gl), Gujarati (gu), Hausa (ha), Hawaiianisch (haw), Hmong (hmn), Haitianisch-Kreolisch (ht), Armenisch (hy), Igbo (ig), Isländisch (is), Javanisch (jv), Georgisch (ka), Kasachisch (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdisch (ku), Kirgisisch (ky), Lateinisch (la), Luxemburgisch (lb), Laotisch (lo), Malagasy (mg), Maori (mi), Mazedonisch (mk), Malayalam (ml), Mongolisch (mn), Meitei (Manipuri) (mni-Mtei), Marathi (mr), Malaysisch (ms), Maltesisch (mt), Myanmar (Burmesisch) (my), Nepalesisch (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Paschtu (ps), Sindhi (sd), Sinhala (Singhalesisch) (si), Samoanisch (sm), Shona (sn), Somali (so), Albanisch (sq), Sesotho (st), Sundanesisch (su), Tamil (ta), Telugu (te), Tadschikisch (tg), Uigurisch (ug), Urdu (ur), Usbekisch (uz), Xhosa (xh), Jiddisch (yi), Yoruba (yo), Zulu (zu)
Imagen
Allgemeine Verfügbarkeit: Englisch
Vorschau: Chinesisch (vereinfacht), Chinesisch (traditionell), Hindi, Japanisch, Koreanisch, Portugiesisch, Spanisch
Informationen zu älteren Modellen
Firebase AI Logic unterstützt die älteren aktiven Gemini-Modelle (z. B. Gemini 1.5-Modelle).
Firebase AI Logic unterstützt die älteren Imagen-Modelle (z. B. Imagen 2) nicht.
Modell | Eingabe | Ausgabe | Optimiert für |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
Text, Code, PDFs, Bilder, Videos, Audio | Text, Code, JSON | Unterstützt komplexe Aufgaben, die mehr Intelligenz erfordern; 2 Millionen Tokens langer Kontext |
Gemini 1.5 Flashgemini-1.5-flash-002 |
Text, Code, PDFs, Bilder, Videos, Audio | Text, Code, JSON | Schnelle und vielseitige Leistung bei einer Vielzahl von Aufgaben |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
Nächste Schritte
Funktionen von Gemini API ausprobieren
- Wechselseitige Unterhaltungen (Chat) erstellen
- Text aus reinen Text-Prompts generieren
- Sie können Text generieren, indem Sie Prompts mit verschiedenen Dateitypen wie Bildern, PDFs, Videos und Audiodateien verwenden.
- Strukturierte Ausgabe (z. B. JSON) aus Text- und multimodalen Prompts generieren.
- Bilder aus Text-Prompts generieren (Gemini oder Imagen).
- Stream-Ein- und -Ausgabe (einschließlich Audio) mit Gemini Live API.
- Verwenden Sie Funktionsaufrufe, um generative Modelle mit externen Systemen und Informationen zu verbinden.