En savoir plus sur les modèles compatibles

Pour les applications mobiles et Web, les SDK Firebase AI Logic vous permettent d'interagir avec les modèles Gemini et modèles Imagen 3 compatibles directement depuis votre application.

Les modèles Gemini sont considérés comme multimodaux, car ils sont capables de traiter et même de générer plusieurs modalités, y compris du texte, du code, des PDF, des images, de la vidéo et de l'audio. Les modèles Imagen 3 peuvent être invités à générer des images à partir de texte.

Le tableau suivant est un aperçu rapide des modèles compatibles avec Firebase AI Logic et de leurs derniers noms de modèles stables. Ce tableau liste également les modèles en avant-première et expérimentaux disponibles pour le prototypage de cas d'utilisation.

Modèle Entrée Sortie Description
Modèles Gemini avec versions stables
Gemini 2.0 Flash
gemini-2.0-flash-001
texte, code, PDF, images, vidéo, audio texte, code, JSON
(images et audio bientôt disponibles)
Notre modèle multimodal avec des fonctionnalités de nouvelle génération et des fonctionnalités améliorées, y compris une vitesse supérieure, l'utilisation d'outils intégrés et une fenêtre de contexte d'un million de jetons (génération multimodale bientôt disponible)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
texte, code, PDF, images, vidéo, audio texte, code, JSON Notre modèle Flash le plus rapide et le plus économique. Il s'agit d'un chemin d'accès pour les utilisateurs de Flash 1.5 qui souhaitent une meilleure qualité pour le même prix et la même vitesse.
Modèles Gemini avec uniquement les versions preview et expérimentales (recommandé pour les cas d'utilisation de prototypage uniquement)
Gemini 2.5 Pro
gemini-2.5-pro-preview-05-06
texte, code, PDF, images, vidéo, audio texte, code, JSON Notre modèle de raisonnement le plus avancé, capable de résoudre des problèmes complexes
Gemini 2.5 Flash
gemini-2.5-flash-preview-04-17
texte, code, PDF, images, vidéo, audio texte, code, JSON Notre modèle de réflexion qui offre des fonctionnalités complètes et de qualité Il est conçu pour offrir un juste équilibre entre prix et performances.
Gemini 2.0 Flash‑Live 1
gemini-2.0-flash-live-preview-04-09
texte (streaming),
audio (streaming)
texte (streaming),
audio (streaming)
Notre modèle multimodal compatible avec le streaming en temps réel à faible latence des entrées et des sorties multimodales.
Modèles Imagen 3 (lorsque vous les utilisez avec Firebase AI Logic)
Imagen 3
imagen-3.0-generate-002
texte images Génère des images réalistes et de haute qualité à partir de requêtes textuelles en langage naturel.
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
texte images Génère des images pour le prototypage ou les cas d'utilisation à faible latence

1 Non compatible avec l'utilisation de Gemini Developer API avec les SDK Firebase AI Logic.
2 Non compatible avec Gemini Developer API, quelle que soit la méthode d'accès à l'API.

Consultez également nos questions fréquentes sur tous les modèles compatibles et non compatibles avec Firebase AI Logic.


Le reste de cette page fournit des informations détaillées sur les modèles compatibles avec Firebase AI Logic.

  • Comparer des modèles:

    • Entrée et sortie compatibles
    • Comparaison générale des fonctionnalités compatibles
    • Spécifications et limites, par exemple nombre maximal de jetons d'entrée ou durée maximale de la vidéo d'entrée
  • Description de la gestion des versions des modèles, en particulier de leurs versions stable, mise à jour automatique, preview et expérimentale

  • Listes des noms de modèles disponibles à inclure dans votre code lors de l'initialisation

  • Listes des langues acceptées pour les modèles

En bas de cette page, vous pouvez consulter des informations détaillées sur les anciens modèles.



Comparer des modèles

Chaque modèle dispose de fonctionnalités différentes pour prendre en charge différents cas d'utilisation. Notez que chacun des tableaux de cette section décrit chaque modèle lorsqu'il est utilisé avec Firebase AI Logic. Chaque modèle peut avoir des fonctionnalités supplémentaires qui ne sont pas disponibles lorsque vous utilisez nos SDK.

Si vous ne trouvez pas les informations que vous recherchez dans les sous-sections suivantes, vous pouvez en trouver d'autres dans la documentation du fournisseur d'API de votre choix:

Entrée et sortie compatibles

Voici les types d'entrées et de sorties compatibles lorsque vous utilisez chaque modèle avec Firebase AI Logic:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Types d'entrée
Texte
Texte (streaming)
Code
Documents
(PDF ou texte brut)
Images
Vidéo
Audio
Audio (streaming)
Types de sortie
Texte
Texte (streaming)
Code
Sortie structurée
(comme JSON)
Images bientôt disponible
Audio bientôt disponible
Audio (streaming)

Pour en savoir plus sur les types de fichiers acceptés, consultez la section Fichiers d'entrée et exigences acceptés.

Fonctionnalités et fonctionnalités compatibles

Voici les fonctionnalités et fonctionnalités compatibles lorsque vous utilisez chaque modèle avec Firebase AI Logic:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Générer du texte à partir d'entrées textuelles ou multimodales streaming uniquement
Générer des images
(Imagen 3)
bientôt disponible
Générer de l'audio bientôt disponible streaming uniquement
Générer une sortie structurée
(comme JSON)
Analyser des documents
(PDF ou texte brut)
Analyser des images (vision)
Analyser des vidéos (vision)
Analyser l'audio streaming uniquement
Chat multitour
Appel de fonction (outils)
Compter les jetons
Instructions système
Streaming multimodal bidirectionnel

Spécifications et limites

Voici les spécifications et les limites lorsque vous utilisez chaque modèle avec Firebase AI Logic:

Propriété <span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Fenêtre de contexte *
Limite totale de jetons
(entrée + sortie combinées)
1 048 576 jetons 1 048 576 jetons 1 048 576 jetons 1 048 576 jetons 32 768 jetons 480 jetons
Limite de jetons de sortie * 65 536 jetons 65 536 jetons 8 192 jetons 8 192 jetons --- ---
Date limite des connaissances (ou "knowledge cutoff") Janvier 2025 Janvier 2025 Juin 2024 Juin 2024 Août 2024 ---
PDF (sur demande)
Nombre maximal
de fichiers PDF d'entrée **
3 000 fichiers 3 000 fichiers 3 000 fichiers 3 000 fichiers --- ---
Nombre maximal
de pages
par fichier PDF d'entrée **
1 000 pages 1 000 pages 1 000 pages 1 000 pages --- ---
Taille maximale
par fichier PDF d'entrée
50 Mo 50 Mo 50 Mo 50 Mo --- ---
Images (par requête)
Nombre maximal
d'images d'entrée
3 000 images 3 000 images 3 000 images 3 000 images --- ---
Nombre maximal
d'images de sortie
--- --- bientôt disponible --- --- 4 images
Taille maximale
par image encodée en base64 d'entrée
7 Mo 7 Mo 7 Mo 7 Mo --- ---
Vidéo (par demande)
Nombre maximal
de fichiers vidéo d'entrée
10 fichiers 10 fichiers 10 fichiers 10 fichiers --- ---
Longueur maximale
de toutes les vidéos d'entrée
(images uniquement)
60 minutes environ 60 minutes environ 60 minutes environ 60 minutes environ --- ---
Durée maximale
de toutes les vidéos d'entrée
(images + audio)
45 minutes environ 45 minutes environ 45 minutes environ 45 minutes environ --- ---
Audio (sur demande)
Nombre maximal
de fichiers audio d'entrée
1 fichier 1 fichier 1 fichier 1 fichier --- ---
Nombre maximal
de fichiers audio de sortie
--- --- bientôt disponible --- --- ---
Longueur maximale
de tous les éléments audio d'entrée
~8,4 heures ~8,4 heures ~8,4 heures ~8,4 heures --- ---
Longueur maximale
de tous les éléments audio de sortie
--- --- bientôt disponible --- --- ---

* Pour tous les modèles Gemini, un jeton équivaut à environ quatre caractères. Ainsi, 100 jetons correspondent à environ 60 à 80 mots en anglais. Pour les modèles Gemini, vous pouvez déterminer le nombre total de jetons dans vos requêtes à l'aide de countTokens.

** Les PDF sont traités comme des images. Ainsi, une page individuelle d'un PDF est traitée comme une image individuelle. Le nombre de pages autorisées dans une requête est limité au nombre d'images que le modèle peut accepter.

Obtenir des informations détaillées supplémentaires



Gestion des versions et schémas de dénomination des modèles

Les modèles sont proposés en versions stable, preview et expérimentale. Pour plus de commodité, les alias sans valeurs de version explicites sont acceptés.

Pour trouver des noms de modèles spécifiques à utiliser dans votre code, consultez la section "Noms de modèles disponibles" plus loin sur cette page.

Type de version /
Étape de version
Description Format de nom de modèle
Stable Les versions stables sont disponibles et compatibles pour une utilisation en production à partir de la date de sortie.

Une version de modèle stable est généralement publiée avec une date d'abandon, qui indique le dernier jour où le modèle est disponible. Passé cette date, le modèle n'est plus accessible ni pris en charge par Google.

Un numéro de version à trois chiffres spécifique est ajouté au nom des modèles des versions stables.

Exemple: gemini-2.0-flash-001
Exemple: imagen-3.0-generate-002

Alias stable mis à jour automatiquement Les alias stables mis à jour automatiquement pointent toujours vers la dernière version stable de ce modèle. Si une nouvelle version stable est publiée, l'alias mis à jour automatiquement commence automatiquement à pointer vers cette nouvelle version stable.

Les noms de modèle des alias ne comportent aucun suffixe.

Exemple: gemini-2.0-flash

Aperçu Les versions preview proposent de nouvelles fonctionnalités et sont considérées comme non stables.

Les versions preview pointent toujours vers la dernière version preview de ce modèle. Si une nouvelle version preview est publiée, toute version preview existante commence automatiquement à pointer vers cette nouvelle version preview.

Ces modèles, qui ne sont pas recommandés pour une utilisation en production, sont assortis de limites de débit plus restrictives et peuvent avoir des exigences de facturation.

Le nom des modèles des versions preview est suivi de -preview, ainsi que de la date de sortie du modèle (-MM-DD).

Exemple: gemini-2.5-flash-preview-04-17
(publié le 17 avril 2025)

Expérimental Les versions expérimentales disposent de nouvelles fonctionnalités et sont considérées comme non stables.

Ces modèles ne sont pas recommandés pour une utilisation en production et sont associés à des limites de débit plus restrictives. Les modèles expérimentaux sont destinés à recueillir des commentaires et à tester nos dernières fonctionnalités.

Le nom des modèles des versions expérimentales est suivi de -exp, ainsi que de la date de sortie du modèle (-MM-DD).

Exemple: gemini-2.5-pro-exp-03-25
(publié le 25 mars 2025)

Retraité(e) Les versions obsolètes ont dépassé leur date d'abandon et ont été définitivement désactivées.

Les modèles obsolètes ne sont plus accessibles ni pris en charge par Google. Les requêtes qui font référence à un ID de modèle abandonné renvoient généralement une erreur 404.

---



Noms de modèles disponibles

Les noms de modèle sont les valeurs explicites que vous incluez dans votre code lors de l'initialisation du modèle.

Répertorier tous les modèles disponibles de manière programmatique

Vous pouvez lister tous les noms de modèles disponibles à l'aide de l'API REST:

Notez que cette liste inclura tous les modèles compatibles avec les fournisseurs d'API, mais Firebase AI Logic n'est compatible qu'avec les modèles Gemini et Imagen décrits sur cette page. Notez également que les alias mis à jour automatiquement (par exemple, gemini-2.0-flash) ne sont pas listés, car il s'agit d'un alias pratique pour le modèle de base.

Noms des modèles Gemini

Pour obtenir des exemples d'initialisation pour votre plate-forme, consultez le guide de démarrage.

Pour en savoir plus sur les étapes de publication (en particulier pour les cas d'utilisation et la facturation), consultez la section Modèles de dénomination et gestion des versions des modèles.

Noms des modèles Gemini 2.5 Pro

Nom du modèle Description Étape de la version Date de disponibilité Date de fin de validité
gemini-2.5-pro-preview-05-06 Version preview de Gemini 2.5 Pro Aperçu 2025-05-06 À déterminer
gemini-2.5-pro-preview-03-25 Version preview pointant vers gemini-2.5-pro-preview-05-06
(version preview la plus récente)
Aperçu 25/03/2025 À déterminer

Noms des modèles Gemini 2.5 Flash

Nom du modèle Description Étape de la version Date de disponibilité Date de fin de validité
gemini-2.5-flash-preview-04-17 Version preview de Gemini 2.5 Flash Aperçu 2025-04-17 À déterminer

Noms des modèles Gemini 2.0 Flash

Nom du modèle Description Étape de la version Date de disponibilité Date de fin de validité
gemini-2.0-flash-001 Dernière version stable de Gemini 2.0 Flash Stable 2025-02-05 Au plus tôt le
05/02/2026
gemini-2.0-flash Alias mis à jour automatiquement pointant vers la dernière version stable de Flash 2.0
(actuellement gemini-2.0-flash-001)
Stable 2025-02-10 ---

Noms des modèles Gemini 2.0 Flash‑Lite

Nom du modèle Description Étape de la version Date de disponibilité Date de fin de validité
gemini-2.0-flash-lite-001 Dernière version stable de Gemini 2.0 Flash‑Lite Stable 2025-02-25 Au plus tôt le
25/02/2026
gemini-2.0-flash-lite Alias mis à jour automatiquement pointant vers la dernière version stable de Flash-Lite 2.0
(actuellement gemini-2.0-flash-lite-001)
Stable 2025-02-25 ---

Noms des modèles Gemini 2.0 Flash‑Live

Disponible uniquement lorsque vous utilisez Vertex AI Gemini API comme fournisseur d'API.

Nom du modèle Description Étape de la version Date de disponibilité Date de fin de validité
gemini-2.0-flash-live-preview-04-09 1 Version Preview pour Gemini 2.0 Flash‑Live Aperçu 2025-04-09 À déterminer

1 Non compatible avec l'utilisation de Gemini Developer API avec les SDK Firebase AI Logic.

Noms des modèles Imagen

Pour obtenir des exemples d'initialisation pour votre plate-forme, consultez le guide de génération d'images avec Imagen.

Pour en savoir plus sur les étapes de publication (en particulier pour les cas d'utilisation et la facturation), consultez la section Modèles de dénomination et gestion des versions des modèles.

Noms des modèles Imagen 3

Nom du modèle Description Étape de la version Date de disponibilité Date de fin de validité
imagen-3.0-generate-002 Dernière version stable de Imagen 3 Stable 2025-01-23 Au plus tôt le 23 janvier 2026
imagen-3.0-generate-001 2 Version stable initiale de Imagen 3 Stable 2024-07-31 Au plus tôt le 31/07/2025

Noms des modèles Imagen 3 Fast

Nom du modèle Description Étape de la version Date de disponibilité Date de fin de validité
imagen-3.0-fast-generate-001 2 Version stable initiale de Imagen 3 Fast Stable 2024-07-31 Au plus tôt le 31/07/2025

2 Non compatible avec Gemini Developer API, quelle que soit la méthode d'accès à l'API.



Langues disponibles

Gemini

  • Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes:

    Arabe (ar), bengali (bn), bulgare (bg), chinois simplifié et traditionnel (zh), croate (hr), tchèque (cs), danois (da), néerlandais (nl), anglais (en), estonien (et), finnois (fi), français (fr), allemand (de), grec (el), hébreu (iw), hindi (hi), hongrois (hu), indonésien (id), italien (it), japonais (ja), coréen (ko), letton (lv), lituanien (lt), norvégien (no), polonais (pl), portugais (pt), roumain (ro), russe (ru), serbe (sr), slovaque (sk), slovène (sl), espagnol (es), swahili (sw), suédois (sv), thaï (th), turc (tr), ukrainien (uk), vietnamien (vi)

  • Les modèles Gemini 2.0 Flash, Gemini 1.5 Pro et Gemini 1.5 Flash peuvent comprendre et répondre dans les langues supplémentaires suivantes:

    Afrikaans (af), amharique (am), assamais (as), azéri (az), biélorusse (be), bosniaque (bs), catalan (ca), cebuano (ceb), corse (co), gallois (cy), divehi (dv), espéranto (eo), basque (eu), farsi (fa), philippin (tagalog) (fil), frison (fy), irlandais (ga), gaélique écossais (gd), galicien (gl), gujarati (gu), haoussa (ha), hawaïen (haw), hmong (hmn), créole haïtien (ht), arménien (hy), igbo (ig), islandais (is), javanais (jv), géorgien (ka), kazakh (kk), khmer (km), kannara (kn), krio (kri), kurde (ku), kirghize (ky), latin (la), luxembourgeois (lb), lao (lo), malgache (mg), maori (mi), macédonien (mk), malayalam (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marathi (mr), malais (ms), maltais (mt), myanmar (birman) (my), népalais (ne), nyanja (chichewa) (ny), odia (oriya) (or), pendjabi (pa), pachto (ps), sindhî (sd), singhalais (sinhalé) (si), samoan (sm), shona (sn), somali (so), albanais (sq), sesotho (st), Soundanais (su), tamoul (ta), télougou (te), tadjik (tg), ouïghour (ug), ourdou (ur), ouzbek (uz), xhosa (xh), yiddish (yi), yoruba (yo), zoulou (zu)

Imagen

  • Disponibilité générale: anglais

  • Aperçu: chinois (simplifié), chinois (traditionnel), hindi, japonais, coréen, portugais et espagnol



Informations sur les anciens modèles

Firebase AI Logic est compatible avec les anciens modèles Gemini actifs (comme les modèles Gemini 1.5).

Firebase AI Logic n'est pas compatible avec les anciens modèles Imagen (comme Imagen 2).

Modèle Entrée Sortie Optimisé pour
Gemini 1.5 Pro
gemini-1.5-pro-002
texte, code, PDF, images, vidéo, audio texte, code, JSON Compatible avec les tâches de raisonnement complexes nécessitant plus d'intelligence ; contexte de 2 millions de jetons
Gemini 1.5 Flash
gemini-1.5-flash-002
texte, code, PDF, images, vidéo, audio texte, code, JSON Offre des performances rapides et polyvalentes pour diverses tâches
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
texte, code, PDF, images, vidéo (cadres uniquement) text, code Gère le texte, les images et les vidéos pour les réponses textuelles ou de code. Ne peut pas être utilisé pour le chat.
Gemini 1.0 Pro
gemini-1.0-pro-002
text, code text, code Tâches en langage naturel, chat textuel et de code multitours, ainsi que génération de code



Étapes suivantes

Essayer les fonctionnalités de Gemini API