Pour les applications mobiles et Web, les SDK Firebase AI Logic vous permettent d'interagir avec les modèles Gemini et modèles Imagen 3 compatibles directement depuis votre application.
Les modèles Gemini sont considérés comme multimodaux, car ils sont capables de traiter et même de générer plusieurs modalités, y compris du texte, du code, des PDF, des images, de la vidéo et de l'audio. Les modèles Imagen 3 peuvent être invités à générer des images à partir de texte.
Le tableau suivant est un aperçu rapide des modèles compatibles avec Firebase AI Logic et de leurs derniers noms de modèles stables. Ce tableau liste également les modèles en avant-première et expérimentaux disponibles pour le prototypage de cas d'utilisation.
Modèle | Entrée | Sortie | Description |
---|---|---|---|
Modèles Gemini avec versions stables | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
texte, code, PDF, images, vidéo, audio | texte, code, JSON (images et audio bientôt disponibles) |
Notre modèle multimodal avec des fonctionnalités de nouvelle génération et des fonctionnalités améliorées, y compris une vitesse supérieure, l'utilisation d'outils intégrés et une fenêtre de contexte d'un million de jetons (génération multimodale bientôt disponible) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Notre modèle Flash le plus rapide et le plus économique. Il s'agit d'un chemin d'accès pour les utilisateurs de Flash 1.5 qui souhaitent une meilleure qualité pour le même prix et la même vitesse. |
Modèles Gemini avec uniquement les versions preview et expérimentales (recommandé pour les cas d'utilisation de prototypage uniquement) | |||
Gemini 2.5 Progemini-2.5-pro-preview-05-06
|
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Notre modèle de raisonnement le plus avancé, capable de résoudre des problèmes complexes |
Gemini 2.5 Flashgemini-2.5-flash-preview-04-17
|
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Notre modèle de réflexion qui offre des fonctionnalités complètes et de qualité Il est conçu pour offrir un juste équilibre entre prix et performances. |
Gemini 2.0 Flash‑Live 1gemini-2.0-flash-live-preview-04-09
|
texte (streaming), audio (streaming) |
texte (streaming), audio (streaming) |
Notre modèle multimodal compatible avec le streaming en temps réel à faible latence des entrées et des sorties multimodales. |
Modèles Imagen 3 (lorsque vous les utilisez avec Firebase AI Logic) | |||
Imagen 3imagen-3.0-generate-002 |
texte | images | Génère des images réalistes et de haute qualité à partir de requêtes textuelles en langage naturel. |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
texte | images | Génère des images pour le prototypage ou les cas d'utilisation à faible latence |
1 Non compatible avec l'utilisation de Gemini Developer API avec les SDK Firebase AI Logic.
2 Non compatible avec Gemini Developer API, quelle que soit la méthode d'accès à l'API.
Consultez également nos questions fréquentes sur tous les modèles compatibles et non compatibles avec Firebase AI Logic.
Le reste de cette page fournit des informations détaillées sur les modèles compatibles avec Firebase AI Logic.
-
- Entrée et sortie compatibles
- Comparaison générale des fonctionnalités compatibles
- Spécifications et limites, par exemple nombre maximal de jetons d'entrée ou durée maximale de la vidéo d'entrée
Description de la gestion des versions des modèles, en particulier de leurs versions stable, mise à jour automatique, preview et expérimentale
Listes des noms de modèles disponibles à inclure dans votre code lors de l'initialisation
Listes des langues acceptées pour les modèles
En bas de cette page, vous pouvez consulter des informations détaillées sur les anciens modèles.
Comparer des modèles
Chaque modèle dispose de fonctionnalités différentes pour prendre en charge différents cas d'utilisation. Notez que chacun des tableaux de cette section décrit chaque modèle lorsqu'il est utilisé avec Firebase AI Logic. Chaque modèle peut avoir des fonctionnalités supplémentaires qui ne sont pas disponibles lorsque vous utilisez nos SDK.
Si vous ne trouvez pas les informations que vous recherchez dans les sous-sections suivantes, vous pouvez en trouver d'autres dans la documentation du fournisseur d'API de votre choix:
Gemini Developer API : modèles Gemini et modèles Imagen
Vertex AI Gemini API : modèles Gemini et modèles Imagen
Entrée et sortie compatibles
Voici les types d'entrées et de sorties compatibles lorsque vous utilisez chaque modèle avec Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|||
---|---|---|---|---|---|---|---|---|
Types d'entrée | ||||||||
Texte | ||||||||
Texte (streaming) | ||||||||
Code | ||||||||
Documents (PDF ou texte brut) |
||||||||
Images | ||||||||
Vidéo | ||||||||
Audio | ||||||||
Audio (streaming) | ||||||||
Types de sortie | ||||||||
Texte | ||||||||
Texte (streaming) | ||||||||
Code | ||||||||
Sortie structurée (comme JSON) |
||||||||
Images | bientôt disponible | |||||||
Audio | bientôt disponible | |||||||
Audio (streaming) |
Pour en savoir plus sur les types de fichiers acceptés, consultez la section Fichiers d'entrée et exigences acceptés.
Fonctionnalités et fonctionnalités compatibles
Voici les fonctionnalités et fonctionnalités compatibles lorsque vous utilisez chaque modèle avec Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|
Générer du texte à partir d'entrées textuelles ou multimodales | streaming uniquement | |||||
Générer des images (Imagen 3) |
bientôt disponible | |||||
Générer de l'audio | bientôt disponible | streaming uniquement | ||||
Générer une sortie structurée
(comme JSON) |
||||||
Analyser des documents
(PDF ou texte brut) |
||||||
Analyser des images (vision) | ||||||
Analyser des vidéos (vision) | ||||||
Analyser l'audio | streaming uniquement | |||||
Chat multitour | ||||||
Appel de fonction (outils) | ||||||
Compter les jetons | ||||||
Instructions système | ||||||
Streaming multimodal bidirectionnel |
Spécifications et limites
Voici les spécifications et les limites lorsque vous utilisez chaque modèle avec Firebase AI Logic:
Propriété |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|---|
Fenêtre de contexte * Limite totale de jetons (entrée + sortie combinées) |
1 048 576 jetons | 1 048 576 jetons | 1 048 576 jetons | 1 048 576 jetons | 32 768 jetons | 480 jetons | |
Limite de jetons de sortie * | 65 536 jetons | 65 536 jetons | 8 192 jetons | 8 192 jetons | --- | --- | |
Date limite des connaissances (ou "knowledge cutoff") | Janvier 2025 | Janvier 2025 | Juin 2024 | Juin 2024 | Août 2024 | --- | |
PDF (sur demande) | |||||||
Nombre maximal de fichiers PDF d'entrée ** |
3 000 fichiers | 3 000 fichiers | 3 000 fichiers | 3 000 fichiers | --- | --- | |
Nombre maximal de pages par fichier PDF d'entrée ** |
1 000 pages | 1 000 pages | 1 000 pages | 1 000 pages | --- | --- | |
Taille maximale par fichier PDF d'entrée |
50 Mo | 50 Mo | 50 Mo | 50 Mo | --- | --- | |
Images (par requête) | |||||||
Nombre maximal d'images d'entrée |
3 000 images | 3 000 images | 3 000 images | 3 000 images | --- | --- | |
Nombre maximal d'images de sortie |
--- | --- | bientôt disponible | --- | --- | 4 images | |
Taille maximale par image encodée en base64 d'entrée |
7 Mo | 7 Mo | 7 Mo | 7 Mo | --- | --- | |
Vidéo (par demande) | |||||||
Nombre maximal de fichiers vidéo d'entrée |
10 fichiers | 10 fichiers | 10 fichiers | 10 fichiers | --- | --- | |
Longueur maximale de toutes les vidéos d'entrée (images uniquement) |
60 minutes environ | 60 minutes environ | 60 minutes environ | 60 minutes environ | --- | --- | |
Durée maximale de toutes les vidéos d'entrée (images + audio) |
45 minutes environ | 45 minutes environ | 45 minutes environ | 45 minutes environ | --- | --- | |
Audio (sur demande) | |||||||
Nombre maximal de fichiers audio d'entrée |
1 fichier | 1 fichier | 1 fichier | 1 fichier | --- | --- | |
Nombre maximal de fichiers audio de sortie |
--- | --- | bientôt disponible | --- | --- | --- | |
Longueur maximale de tous les éléments audio d'entrée |
~8,4 heures | ~8,4 heures | ~8,4 heures | ~8,4 heures | --- | --- | |
Longueur maximale de tous les éléments audio de sortie |
--- | --- | bientôt disponible | --- | --- | --- |
*
Pour tous les modèles Gemini, un jeton équivaut à environ quatre caractères. Ainsi, 100 jetons correspondent à environ 60 à 80 mots en anglais. Pour les modèles Gemini, vous pouvez déterminer le nombre total de jetons dans vos requêtes à l'aide de countTokens
.
** Les PDF sont traités comme des images. Ainsi, une page individuelle d'un PDF est traitée comme une image individuelle. Le nombre de pages autorisées dans une requête est limité au nombre d'images que le modèle peut accepter.
Obtenir des informations détaillées supplémentaires
Les quotas et la tarification sont différents pour chaque modèle. La tarification dépend également des entrées et des sorties.
Découvrez les types de fichiers d'entrée compatibles, comment spécifier le type MIME, et comment vous assurer que vos fichiers d'entrée et vos requêtes multimodales répondent aux exigences et respectent les bonnes pratiques dans la section Fichiers d'entrée compatibles et exigences.
Gestion des versions et schémas de dénomination des modèles
Les modèles sont proposés en versions stable, preview et expérimentale. Pour plus de commodité, les alias sans valeurs de version explicites sont acceptés.
Pour trouver des noms de modèles spécifiques à utiliser dans votre code, consultez la section "Noms de modèles disponibles" plus loin sur cette page.
Type de version / Étape de version |
Description | Format de nom de modèle | |
---|---|---|---|
Stable |
Les versions stables sont disponibles et compatibles pour une utilisation en production à partir de la date de sortie.
Une version de modèle stable est généralement publiée avec une date d'abandon, qui indique le dernier jour où le modèle est disponible. Passé cette date, le modèle n'est plus accessible ni pris en charge par Google. |
Un numéro de version à trois chiffres spécifique est ajouté au nom des modèles des versions stables.
Exemple: |
|
Alias stable mis à jour automatiquement | Les alias stables mis à jour automatiquement pointent toujours vers la dernière version stable de ce modèle. Si une nouvelle version stable est publiée, l'alias mis à jour automatiquement commence automatiquement à pointer vers cette nouvelle version stable. |
Les noms de modèle des alias ne comportent aucun suffixe.
Exemple: |
|
Aperçu |
Les versions preview proposent de nouvelles fonctionnalités et sont considérées comme non stables.
Les versions preview pointent toujours vers la dernière version preview de ce modèle. Si une nouvelle version preview est publiée, toute version preview existante commence automatiquement à pointer vers cette nouvelle version preview. Ces modèles, qui ne sont pas recommandés pour une utilisation en production, sont assortis de limites de débit plus restrictives et peuvent avoir des exigences de facturation. |
Le nom des modèles des versions preview est suivi de
Exemple: |
|
Expérimental |
Les versions expérimentales disposent de nouvelles fonctionnalités et sont considérées comme non stables.
Ces modèles ne sont pas recommandés pour une utilisation en production et sont associés à des limites de débit plus restrictives. Les modèles expérimentaux sont destinés à recueillir des commentaires et à tester nos dernières fonctionnalités. |
Le nom des modèles des versions expérimentales est suivi de
Exemple: |
|
Retraité(e) |
Les versions obsolètes ont dépassé leur date d'abandon et ont été définitivement désactivées.
Les modèles obsolètes ne sont plus accessibles ni pris en charge par Google. Les requêtes qui font référence à un ID de modèle abandonné renvoient généralement une erreur 404. |
--- |
Noms de modèles disponibles
Les noms de modèle sont les valeurs explicites que vous incluez dans votre code lors de l'initialisation du modèle.
Répertorier tous les modèles disponibles de manière programmatique
Vous pouvez lister tous les noms de modèles disponibles à l'aide de l'API REST:
Gemini Developer API: appel du point de terminaison
models.list
Vertex AI Gemini API: appel du point de terminaison
publishers.models.list
Notez que cette liste inclura tous les modèles compatibles avec les fournisseurs d'API, mais Firebase AI Logic n'est compatible qu'avec les modèles Gemini et Imagen décrits sur cette page.
Notez également que les alias mis à jour automatiquement (par exemple, gemini-2.0-flash
) ne sont pas listés, car il s'agit d'un alias pratique pour le modèle de base.
Noms des modèles Gemini
Pour obtenir des exemples d'initialisation pour votre plate-forme, consultez le guide de démarrage.
Pour en savoir plus sur les étapes de publication (en particulier pour les cas d'utilisation et la facturation), consultez la section Modèles de dénomination et gestion des versions des modèles.
Noms des modèles Gemini 2.5 Pro
Nom du modèle | Description | Étape de la version | Date de disponibilité | Date de fin de validité |
---|---|---|---|---|
gemini-2.5-pro-preview-05-06 |
Version preview de Gemini 2.5 Pro | Aperçu | 2025-05-06 | À déterminer |
gemini-2.5-pro-preview-03-25 |
Version preview pointant vers gemini-2.5-pro-preview-05-06 (version preview la plus récente) |
Aperçu | 25/03/2025 | À déterminer |
Noms des modèles Gemini 2.5 Flash
Nom du modèle | Description | Étape de la version | Date de disponibilité | Date de fin de validité |
---|---|---|---|---|
gemini-2.5-flash-preview-04-17 |
Version preview de Gemini 2.5 Flash | Aperçu | 2025-04-17 | À déterminer |
Noms des modèles Gemini 2.0 Flash
Nom du modèle | Description | Étape de la version | Date de disponibilité | Date de fin de validité |
---|---|---|---|---|
gemini-2.0-flash-001 |
Dernière version stable de Gemini 2.0 Flash | Stable | 2025-02-05 | Au plus tôt le 05/02/2026 |
gemini-2.0-flash |
Alias mis à jour automatiquement pointant vers la dernière version stable de Flash 2.0 (actuellement gemini-2.0-flash-001 |
Stable | 2025-02-10 | --- |
Noms des modèles Gemini 2.0 Flash‑Lite
Nom du modèle | Description | Étape de la version | Date de disponibilité | Date de fin de validité |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Dernière version stable de Gemini 2.0 Flash‑Lite | Stable | 2025-02-25 | Au plus tôt le 25/02/2026 |
gemini-2.0-flash-lite |
Alias mis à jour automatiquement pointant vers la dernière version stable de Flash-Lite 2.0 (actuellement gemini-2.0-flash-lite-001 |
Stable | 2025-02-25 | --- |
Noms des modèles Gemini 2.0 Flash‑Live
Disponible uniquement lorsque vous utilisez Vertex AI Gemini API comme fournisseur d'API. |
Nom du modèle | Description | Étape de la version | Date de disponibilité | Date de fin de validité |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Version Preview pour Gemini 2.0 Flash‑Live | Aperçu | 2025-04-09 | À déterminer |
1 Non compatible avec l'utilisation de Gemini Developer API avec les SDK Firebase AI Logic.
Noms des modèles Imagen
Pour obtenir des exemples d'initialisation pour votre plate-forme, consultez le guide de génération d'images avec Imagen.
Pour en savoir plus sur les étapes de publication (en particulier pour les cas d'utilisation et la facturation), consultez la section Modèles de dénomination et gestion des versions des modèles.
Noms des modèles Imagen 3
Nom du modèle | Description | Étape de la version | Date de disponibilité | Date de fin de validité |
---|---|---|---|---|
imagen-3.0-generate-002 |
Dernière version stable de Imagen 3 | Stable | 2025-01-23 | Au plus tôt le 23 janvier 2026 |
imagen-3.0-generate-001 2 |
Version stable initiale de Imagen 3 | Stable | 2024-07-31 | Au plus tôt le 31/07/2025 |
Noms des modèles Imagen 3 Fast
Nom du modèle | Description | Étape de la version | Date de disponibilité | Date de fin de validité |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Version stable initiale de Imagen 3 Fast | Stable | 2024-07-31 | Au plus tôt le 31/07/2025 |
2 Non compatible avec Gemini Developer API, quelle que soit la méthode d'accès à l'API.
Langues disponibles
Gemini
Tous les modèles Gemini peuvent comprendre et répondre dans les langues suivantes:
Arabe (ar), bengali (bn), bulgare (bg), chinois simplifié et traditionnel (zh), croate (hr), tchèque (cs), danois (da), néerlandais (nl), anglais (en), estonien (et), finnois (fi), français (fr), allemand (de), grec (el), hébreu (iw), hindi (hi), hongrois (hu), indonésien (id), italien (it), japonais (ja), coréen (ko), letton (lv), lituanien (lt), norvégien (no), polonais (pl), portugais (pt), roumain (ro), russe (ru), serbe (sr), slovaque (sk), slovène (sl), espagnol (es), swahili (sw), suédois (sv), thaï (th), turc (tr), ukrainien (uk), vietnamien (vi)
Les modèles Gemini 2.0 Flash, Gemini 1.5 Pro et Gemini 1.5 Flash peuvent comprendre et répondre dans les langues supplémentaires suivantes:
Afrikaans (af), amharique (am), assamais (as), azéri (az), biélorusse (be), bosniaque (bs), catalan (ca), cebuano (ceb), corse (co), gallois (cy), divehi (dv), espéranto (eo), basque (eu), farsi (fa), philippin (tagalog) (fil), frison (fy), irlandais (ga), gaélique écossais (gd), galicien (gl), gujarati (gu), haoussa (ha), hawaïen (haw), hmong (hmn), créole haïtien (ht), arménien (hy), igbo (ig), islandais (is), javanais (jv), géorgien (ka), kazakh (kk), khmer (km), kannara (kn), krio (kri), kurde (ku), kirghize (ky), latin (la), luxembourgeois (lb), lao (lo), malgache (mg), maori (mi), macédonien (mk), malayalam (ml), mongol (mn), meiteilon (Manipuri) (mni-Mtei), marathi (mr), malais (ms), maltais (mt), myanmar (birman) (my), népalais (ne), nyanja (chichewa) (ny), odia (oriya) (or), pendjabi (pa), pachto (ps), sindhî (sd), singhalais (sinhalé) (si), samoan (sm), shona (sn), somali (so), albanais (sq), sesotho (st), Soundanais (su), tamoul (ta), télougou (te), tadjik (tg), ouïghour (ug), ourdou (ur), ouzbek (uz), xhosa (xh), yiddish (yi), yoruba (yo), zoulou (zu)
Imagen
Disponibilité générale: anglais
Aperçu: chinois (simplifié), chinois (traditionnel), hindi, japonais, coréen, portugais et espagnol
Informations sur les anciens modèles
Firebase AI Logic est compatible avec les anciens modèles Gemini actifs (comme les modèles Gemini 1.5).
Firebase AI Logic n'est pas compatible avec les anciens modèles Imagen (comme Imagen 2).
Modèle | Entrée | Sortie | Optimisé pour |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Compatible avec les tâches de raisonnement complexes nécessitant plus d'intelligence ; contexte de 2 millions de jetons |
Gemini 1.5 Flashgemini-1.5-flash-002 |
texte, code, PDF, images, vidéo, audio | texte, code, JSON | Offre des performances rapides et polyvalentes pour diverses tâches |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
Étapes suivantes
Essayer les fonctionnalités de Gemini API
- Créez des conversations multitours (chat).
- Générez du texte à partir de requêtes textuelles uniquement.
- Générez du texte en interrogeant l'utilisateur avec différents types de fichiers, comme des images, des PDF, des vidéos et des audios.
- Générez une sortie structurée (comme JSON) à partir d'invites textuelles et multimodales.
- Générez des images à partir de requêtes textuelles.
- Diffusez des entrées et des sorties (y compris audio) à l'aide de Gemini Live API.
- Utilisez l'appel de fonction pour connecter des modèles génératifs à des systèmes et des informations externes.