Limites de taxa e cotas

Clique no seu provedor de Gemini API para conferir o conteúdo e o código específicos do provedor nesta página.


Os limites de taxa (geralmente chamados de cotas) regulam o número de solicitações que você pode fazer para o Gemini API em um determinado período. Esses limites ajudam a garantir o uso justo, protegem contra abuso e ajudam a manter o desempenho do sistema para todos os usuários.

Ao usar Firebase AI Logic para enviar solicitações aos modelos Gemini e Imagen, os limites de taxa do projeto dependem do provedor Gemini API escolhido. O Firebase AI Logic também oferece uma maneira de definir limites de taxa "por usuário".

Conferir os limites de taxa do Gemini Developer API

Como funcionam os limites de taxa (cotas)

Os limites de taxa (cotas) são medidos em quatro dimensões:

  • Solicitações por minuto (RPM)
  • Solicitações por dia (RPD)
  • Tokens por minuto (TPM)
  • Tokens por dia (TPD)

Seu uso é avaliado em relação a cada limite, e o excesso de qualquer um deles aciona um erro 429 de cota excedida. Por exemplo, se o limite de RPM for 20, fazer 21 solicitações em um minuto resultará em um erro, mesmo que você não tenha excedido o TPM ou outros limites.

Os limites de taxa são aplicados no nível do projeto e se aplicam a todos os aplicativos e endereços IP que usam esse projeto do Firebase.

Os limites variam de acordo com o modelo específico usado, e alguns limites se aplicam apenas a modelos específicos. Por exemplo, as imagens por minuto (IPM) são calculadas apenas para modelos capazes de gerar imagens (Imagen 3), mas são conceitualmente semelhantes ao TPM.

Os limites de taxa são mais restritos para modelos experimentais e de visualização.

Solicitar um aumento no limite de taxa

Se você estiver em um "nível pago" para o Gemini Developer API, poderá solicitar um aumento no limite de taxa.

Definir limites de taxa "por usuário"

Para usar o Firebase AI Logic, o projeto precisa ter o provedor Gemini API escolhido ativado, mas também precisa ter a API Firebase AI Logic ativada, que atua como um gateway entre nossos SDKs de cliente e o provedor Gemini API. Essa API é ativada quando você configura o Firebase AI Logic no seu projeto do Firebase.

É possível usar o limite de taxa (cota) da API Firebase AI Logic como um limite de taxa "por usuário" do app, especificamente para os recursos de IA que dependem de Firebase AI Logic. É necessário definir esse limite para acomodar razoavelmente um único usuário que acesse os recursos de IA, além de garantir que nenhum usuário ultrapasse os limites do provedor de Gemini API, que é compartilhado por todos os usuários.

Detalhes sobre o limite de taxa "por usuário"

Confira alguns detalhes importantes sobre os limites de taxa (cotas) da API Firebase AI Logic, especificamente, solicitações por minuto (RPM):

  • Ele é baseado em "Gerar solicitações de conteúdo" por usuário, por região e por minuto, e não é baseado no modelo.

  • Ela se aplica ao nível do projeto e a todos os aplicativos e endereços IP que usam esse projeto do Firebase.

  • Ela se aplica a qualquer chamada que venha especificamente de qualquer SDK Firebase AI Logic.

  • O limite de taxa padrão é de 100 RPM por usuário.
    Você ainda precisa considerar os limites do provedor Gemini API (consulte acima), que têm precedência sobre a API Firebase AI Logic.

Ajustar o limite de taxa "por usuário"

Para ajustar um limite de taxa (cota), você precisa ter a permissão serviceusage.quotas.update, incluída por padrão na função de proprietário e editor.

Veja como editar o limite de taxa (cota) ou solicitar um aumento:

  1. No console Google Cloud, acesse a página da API Firebase AI Logic.

  2. Clique em Gerenciar.

  3. Mais abaixo na página, clique na guia Cotas e limites do sistema.

  4. Filtre a tabela para mostrar as cotas de interesse, como o recurso (solicitações para gerar conteúdo) e a região.

    Por exemplo, para conferir as cotas por usuário para gerar solicitações de conteúdo em qualquer uma das regiões da Ásia com suporte, seu filtro será semelhante a Generate content requests + Dimension:region:asia.

  5. Marque a caixa de seleção à esquerda de cada cota de interesse.

  6. No final da linha da cota, clique em e selecione Editar cota.

  7. No formulário Mudanças de cota, faça o seguinte:

    1. Insira a cota aumentada no campo Novo valor.

      Essa cota é válida no nível do projeto e é compartilhada em todos os aplicativos e endereços IP que usam esse projeto do Firebase.

    2. Preencha todos os campos do formulário e clique em Concluído.

    3. Clique em Enviar solicitação.