Clique no seu provedor de Gemini API para conferir o conteúdo e o código específicos do provedor nesta página. |
Os limites de taxa (comumente chamados de cotas) regulam o número de solicitações que você pode fazer para o Gemini API em um determinado período. Esses limites ajudam a garantir o uso justo, proteger contra abusos e manter o desempenho do sistema para todos os usuários.
Ao usar Firebase AI Logic para enviar solicitações aos modelos Gemini e Imagen, os limites de taxa do seu projeto dependem do provedor "Gemini API" escolhido. O Firebase AI Logic também oferece uma maneira de definir limites de taxa "por usuário".
Conferir limites de taxa para o Gemini Developer API
Como funcionam os limites de taxa (cotas)
Os limites de taxa (cotas) são medidos em quatro dimensões:
- Solicitações por minuto (RPM)
- Solicitações por dia (RPD)
- Tokens por minuto (TPM)
- Tokens por dia (TPD)
Seu uso é avaliado em relação a cada limite, e exceder qualquer um deles vai acionar um erro 429 de cota excedida. Por exemplo, se o limite de RPM for 20, fazer 21 solicitações em um minuto vai resultar em um erro, mesmo que você não tenha excedido o TPM ou outros limites.
Os limites de taxa são aplicados no nível do projeto e abrangem todos os aplicativos e endereços IP que usam esse projeto do Firebase.
Os limites variam de acordo com o modelo específico usado, e alguns limites se aplicam apenas a modelos específicos. Por exemplo, as imagens por minuto (IPM) só são calculadas para modelos capazes de gerar imagens (Imagen 3), mas são conceitualmente semelhantes aos TPM.
Os limites de taxa são mais restritos para modelos experimentais e de prévia.
Solicitar um aumento no limite de taxa
Se você estiver em um "nível pago" do Gemini Developer API, poderá solicitar um aumento no limite de taxa.
Definir limites de taxa "por usuário"
Para usar o Firebase AI Logic, seu projeto precisa ter o provedor Gemini API escolhido ativado, além da API Firebase AI Logic, que atua como um gateway entre nossos SDKs de cliente e seu provedor Gemini API. Essa API é ativada para você quando você configura inicialmente o Firebase AI Logic no seu projeto do Firebase.
Você pode usar o limite de taxa (cota) da API Firebase AI Logic como um limite de taxa "por usuário" para seu app, especificamente para os recursos de IA que dependem do Firebase AI Logic. Defina esse limite para acomodar razoavelmente um único usuário que acessa seus recursos de IA e garantir que nenhum usuário exceda os limites do seu provedor Gemini API (que deve ser compartilhado por todos os usuários).
Detalhes sobre o limite de taxa "por usuário"
Confira alguns detalhes importantes sobre os limites de taxa (cotas) da API Firebase AI Logic, especificamente, solicitações por minuto (RPM):
Ele se baseia em "Solicitações de geração de conteúdo" por usuário, região e minuto, e não em modelo.
Ela se aplica no nível do projeto e a todos os aplicativos e endereços IP que usam esse projeto do Firebase.
Ela se aplica a qualquer chamada que venha especificamente de um SDK Firebase AI Logic.
O limite de taxa padrão é de 100 RPM por usuário.
Não se esqueça de considerar os limites do seu provedor Gemini API (consulte acima), que têm precedência sobre a API Firebase AI Logic.
Ajustar o limite de taxa "por usuário"
Para ajustar um limite de taxa (cota), você precisa ter a permissão serviceusage.quotas.update
, que está incluída por padrão nos papéis de proprietário e editor.
Veja como editar seu limite de taxa (cota) ou solicitar um aumento:
No console Google Cloud, acesse a página da API Firebase AI Logic.
Clique em Gerenciar.
Mais abaixo na página, clique na guia Cotas e limites do sistema.
Filtre a tabela para mostrar as cotas de interesse, como a capacidade (solicitações de geração de conteúdo) e a região.
Por exemplo, para conferir as cotas por usuário para gerar solicitações de conteúdo em qualquer uma das regiões da Ásia aceitas, seu filtro seria semelhante a este:
Generate content requests
+Dimension:region:asia
Marque a caixa de seleção à esquerda de cada cota de interesse.
No final da linha da cota, clique em
e selecione Editar cota.No formulário Mudanças de cota, faça o seguinte:
Insira a cota aumentada no campo Novo valor.
Essa cota é válida para o projeto e é compartilhada com todos os aplicativos e endereços IP que usam esse projeto do Firebase.
Preencha todos os campos do formulário e clique em Concluído.
Clique em Enviar solicitação.