Limites de débit et quotas

Cliquez sur votre fournisseur Gemini API pour afficher le contenu et le code spécifiques à ce fournisseur sur cette page.


Les limites de débit (communément appelées quotas) régulent le nombre de requêtes que vous pouvez envoyer à Gemini API au cours d'une période donnée. Ces limites permettent d'assurer une utilisation équitable, de protéger contre les utilisations abusives et de maintenir les performances du système pour tous les utilisateurs.

Lorsque vous utilisez Firebase AI Logic pour envoyer des requêtes aux modèles Gemini et Imagen, les limites de débit de votre projet dépendent du fournisseur "Gemini API" que vous avez choisi. Firebase AI Logic permet également de définir des limites de fréquence "par utilisateur".

Afficher les limites de taux pour Gemini Developer API

Fonctionnement des limites de débit (quotas)

Les limites de débit (quotas) sont mesurées selon quatre dimensions :

  • Requêtes par minute (RPM)
  • Requêtes par jour (RPJ)
  • Jetons par minute (TPM)
  • Jetons par jour (TPD)

Votre utilisation est évaluée par rapport à chaque limite. Si vous en dépassez une, une erreur 429 (quota dépassé) se déclenche. Par exemple, si votre limite de requêtes par minute est de 20, vous recevrez une erreur si vous envoyez 21 requêtes en une minute, même si vous n'avez pas dépassé votre limite de requêtes par minute ni d'autres limites.

Les limites de débit sont appliquées au niveau du projet et s'appliquent à toutes les applications et adresses IP qui utilisent ce projet Firebase.

Les limites varient en fonction du modèle spécifique utilisé, et certaines limites ne s'appliquent qu'à certains modèles. Par exemple, les images par minute (IPM) ne sont calculées que pour les modèles capables de générer des images (Imagen 3), mais sont conceptuellement similaires aux TPM.

Les limites de débit sont plus restrictives pour les modèles expérimentaux et en version bêta.

Demander une augmentation de la limite de fréquence

Si vous disposez d'un forfait payant pour Gemini Developer API, vous pouvez demander à augmenter la limite de fréquence.

Définir des limites de débit "par utilisateur"

Pour utiliser Firebase AI Logic, vous devez activer le fournisseur Gemini API de votre choix dans votre projet, mais vous devez également activer l'API Firebase AI Logic, qui sert de passerelle entre nos SDK clients et votre fournisseur Gemini API. Cette API est activée pour vous lorsque vous configurez Firebase AI Logic dans votre projet Firebase.

Vous pouvez utiliser la limite de débit (quota) de l'API Firebase AI Logic comme limite de débit "par utilisateur" pour votre application, en particulier pour les fonctionnalités d'IA qui s'appuient sur Firebase AI Logic. Vous devez définir cette limite pour permettre à un seul utilisateur d'accéder à vos fonctionnalités d'IA de manière raisonnable, tout en veillant à ce qu'aucun utilisateur ne dépasse les limites de votre fournisseur Gemini API (qui est censé être partagé par tous vos utilisateurs).

Détails sur la limite de débit "par utilisateur"

Voici quelques informations importantes sur les limites de débit (quotas) de l'API Firebase AI Logic, en particulier sur les requêtes par minute (RPM) :

  • Elle est basée sur les "demandes de génération de contenu" par utilisateur, par région et par minute, et non sur le modèle.

  • Il s'applique au niveau du projet et à toutes les applications et adresses IP qui utilisent ce projet Firebase.

  • Elle s'applique à tout appel provenant spécifiquement d'un SDK Firebase AI Logic.

  • La limite de débit par défaut est de 100 requêtes par minute et par utilisateur.
    Notez que vous devez toujours tenir compte des limites de votre fournisseur Gemini API (voir ci-dessus), qui prévalent sur l'API Firebase AI Logic.

Ajuster la limite de débit "par utilisateur"

Pour ajuster une limite de fréquence (quota), vous devez disposer de l'autorisation serviceusage.quotas.update, qui est incluse par défaut dans les rôles "Propriétaire" et "Éditeur".

Pour modifier votre limite de fréquence (quota) ou demander une augmentation :

  1. Dans la console Google Cloud, accédez à la page de l'API Firebase AI Logic.

  2. Cliquez sur Gérer.

  3. Plus bas sur la page, cliquez sur l'onglet Quotas et limites du système.

  4. Filtrez le tableau pour afficher les quotas qui vous intéressent, comme la capacité (demandes de génération de contenu) et la région.

    Par exemple, pour afficher les quotas par utilisateur pour les demandes de génération de contenu dans l'une des régions asiatiques acceptées, votre filtre se présenterait comme suit : Generate content requests + Dimension:region:asia

  5. Cochez la case située à gauche de chaque quota qui vous intéresse.

  6. À la fin de la ligne du quota, cliquez sur , puis sélectionnez Modifier le quota.

  7. Dans le formulaire Modifications de quotas, procédez comme suit :

    1. Saisissez le quota augmenté dans le champ Nouvelle valeur.

      Ce quota s'applique au niveau du projet et est partagé entre toutes les applications et adresses IP qui utilisent ce projet Firebase.

    2. Renseignez tous les champs supplémentaires du formulaire, puis cliquez sur OK.

    3. Cliquez sur Envoyer la requête.