Cliquez sur votre fournisseur Gemini API pour afficher le contenu et le code spécifiques à ce fournisseur sur cette page. |
Les limites de débit (communément appelées quotas) régulent le nombre de requêtes que vous pouvez envoyer à Gemini API dans un délai donné. Ces limites permettent de garantir un usage équitable, de protéger contre les utilisations abusives et de maintenir les performances du système pour tous les utilisateurs.
Lorsque vous utilisez Firebase AI Logic pour envoyer des requêtes aux modèles Gemini et Imagen, les limites de débit de votre projet dépendent du fournisseur "Gemini API" que vous avez choisi. Firebase AI Logic permet également de définir des limites de débit par utilisateur.
Consulter les limites de débit pour Gemini Developer API
Fonctionnement des limites de débit (quotas)
Les limites de débit (quotas) sont mesurées dans quatre dimensions:
- Requêtes par minute (RPM)
- Requêtes par jour (RPD)
- Jetons par minute (TPM)
- Jetons par jour (JPJ)
Votre utilisation est évaluée par rapport à chaque limite. Si vous dépassez l'une d'elles, une erreur 429 (quota dépassé) se déclenche. Par exemple, si votre limite de RPM est de 20, l'envoi de 21 requêtes en une minute entraînera une erreur, même si vous n'avez pas dépassé votre TPM ou d'autres limites.
Les limites de débit sont appliquées au niveau du projet et s'appliquent à toutes les applications et adresses IP qui utilisent ce projet Firebase.
Les limites varient en fonction du modèle spécifique utilisé, et certaines ne s'appliquent qu'à des modèles spécifiques. Par exemple, les images par minute (IPM) ne sont calculées que pour les modèles capables de générer des images (Imagen 3), mais sont conceptuellement similaires aux TPM.
Les limites de débit sont plus strictes pour les modèles expérimentaux et les versions Preview.
Demander une augmentation de la limite de débit
Si vous disposez d'un niveau payant pour Gemini Developer API, vous pouvez demander à augmenter la limite de débit.
Définir des limites de débit par utilisateur
Pour utiliser Firebase AI Logic, votre projet doit activer le fournisseur Gemini API de votre choix, mais vous devez également activer l'API Firebase AI Logic, qui sert de passerelle entre nos SDK clients et votre fournisseur Gemini API. Cette API est activée pour vous lorsque vous configurez Firebase AI Logic pour la première fois dans votre projet Firebase.
Vous pouvez utiliser la limite de débit (quota) de l'API Firebase AI Logic comme limite de débit "par utilisateur" pour votre application, en particulier pour les fonctionnalités d'IA qui s'appuient sur Firebase AI Logic. Vous devez définir cette limite pour permettre à un seul utilisateur d'accéder à vos fonctionnalités d'IA, tout en vous assurant qu'aucun utilisateur ne dépasse les limites de votre fournisseur Gemini API (qui est censé être partagé par tous vos utilisateurs).
Informations sur la limite de débit par utilisateur
Voici quelques informations importantes sur les limites de débit (quotas) de l'API Firebase AI Logic, en particulier les requêtes par minute (RPM):
Il est basé sur "Générer des requêtes de contenu" par utilisateur, par région et par minute, et n'est pas basé sur un modèle.
Il s'applique au niveau du projet et à toutes les applications et adresses IP qui utilisent ce projet Firebase.
Il s'applique à tout appel provenant spécifiquement d'un SDK Firebase AI Logic.
La limite de débit par défaut est de 100 RPM par utilisateur.
Notez que vous devez toujours tenir compte des limites de votre fournisseur Gemini API (voir ci-dessus), qui ont la priorité sur l'API Firebase AI Logic.
Ajuster la limite de débit par utilisateur
Pour ajuster une limite de débit (quota), vous devez disposer de l'autorisation serviceusage.quotas.update
, qui est incluse par défaut dans les rôles Propriétaire et Éditeur.
Pour modifier votre limite de débit (quota) ou demander une augmentation:
Dans la console Google Cloud, accédez à la page de l'API Firebase AI Logic.
Cliquez sur Gérer.
Plus bas sur la page, cliquez sur l'onglet Quotas et limites du système.
Filtrez le tableau pour afficher les quotas qui vous intéressent, comme la fonctionnalité (requêtes de génération de contenu) et la région.
Par exemple, pour afficher les quotas par utilisateur pour générer des requêtes de contenu dans l'une des régions asiatiques compatibles, votre filtre se présente comme suit :
Generate content requests
+Dimension:region:asia
Cochez la case située à gauche de chaque quota qui vous intéresse.
À la fin de la ligne du quota, cliquez sur
, puis sélectionnez Modifier le quota.Dans le formulaire Modifications de quotas, procédez comme suit:
Saisissez le quota augmenté dans le champ Nouvelle valeur.
Ce quota s'applique au niveau du projet et est partagé entre toutes les applications et adresses IP qui utilisent ce projet Firebase.
Renseignez tous les champs supplémentaires du formulaire, puis cliquez sur OK.
Cliquez sur Envoyer la requête.