Haz clic en tu proveedor de Gemini API para ver el contenido y el código específicos del proveedor en esta página. |
Los límites de frecuencia (comúnmente llamados cuotas) regulan la cantidad de solicitudes que puedes realizar a Gemini API en un período determinado. Estos límites ayudan a garantizar un uso justo, proteger contra el abuso y mantener el rendimiento del sistema para todos los usuarios.
Cuando usas Firebase AI Logic para enviar solicitudes a los modelos Gemini y Imagen, los límites de frecuencia de tu proyecto dependen del proveedor de "Gemini API" que elijas. Firebase AI Logic también proporciona una forma de establecer límites de frecuencia “por usuario”.
Consulta los límites de frecuencia de Gemini Developer API
Cómo funcionan los límites de frecuencia (cuotas)
Los límites de frecuencia (cuotas) se miden en cuatro dimensiones:
- Solicitudes por minuto (RPM)
- Solicitudes por día (RPD)
- Tokens por minuto (TPM)
- Tokens por día (TPD)
Tu uso se evalúa en función de cada límite y, si superas alguno de ellos, se activará un error de cuota excedida 429. Por ejemplo, si tu límite de RPM es de 20, realizar 21 solicitudes en un minuto generará un error, incluso si no superaste tu TPM ni otros límites.
Los límites de frecuencia se aplican a nivel del proyecto y a todas las aplicaciones y direcciones IP que usan ese proyecto de Firebase.
Los límites varían según el modelo específico que se use, y algunos solo se aplican a modelos específicos. Por ejemplo, las imágenes por minuto (IPM) solo se calculan para los modelos capaces de generar imágenes (Imagen 3), pero son conceptualmente similares a las TPM.
Los límites de frecuencia son más restrictivos para los modelos experimentales y de vista previa.
Solicita un aumento del límite de frecuencia
Si tienes un "nivel pagado" para Gemini Developer API, puedes solicitar un aumento del límite de frecuencia.
Establece límites de frecuencia "por usuario"
Para usar Firebase AI Logic, tu proyecto necesita que el proveedor de Gemini API que elegiste esté habilitado, pero también debes habilitar la API de Firebase AI Logic, que actúa como puerta de enlace entre nuestros SDKs de cliente y tu proveedor de Gemini API. Esta API se habilita cuando configuras Firebase AI Logic por primera vez en tu proyecto de Firebase.
Puedes usar el límite de frecuencia (cuota) de la API de Firebase AI Logic como un límite de frecuencia "por usuario" para tu app, específicamente para las funciones de IA que dependen de Firebase AI Logic. Debes establecer este límite para admitir de forma razonable un solo usuario que acceda a tus funciones de IA y, al mismo tiempo, asegurarte de que ningún usuario supere los límites de tu proveedor de Gemini API (que está diseñado para que lo compartan todos tus usuarios).
Detalles sobre el límite de frecuencia "por usuario"
A continuación, se muestran algunos detalles importantes sobre los límites de frecuencia (cuotas) de la API de Firebase AI Logic, específicamente, las solicitudes por minuto (RPM):
Se basa en "Generar solicitudes de contenido" por usuario, por región y por minuto, y no se basa en el modelo.
Se aplica a nivel del proyecto y a todas las aplicaciones y direcciones IP que usan ese proyecto de Firebase.
Se aplica a cualquier llamada que provenga específicamente de cualquier SDK de Firebase AI Logic.
El límite de frecuencia predeterminado es de 100 RPM por usuario.
Ten en cuenta que aún debes considerar los límites de tu proveedor de Gemini API (consulta más arriba), que tienen prioridad sobre la API de Firebase AI Logic.
Ajusta el límite de frecuencia "por usuario"
Para ajustar un límite de frecuencia (cuota), debes tener el permiso serviceusage.quotas.update
, que se incluye de forma predeterminada en los roles de propietario y editor.
Sigue estos pasos para editar tu límite de frecuencia (cuota) o solicitar un aumento:
En la consola de Google Cloud, ve a la página de la API de Firebase AI Logic.
Haz clic en Administrar.
Más abajo en la página, haz clic en la pestaña Cuotas y límites del sistema.
Filtra la tabla para mostrar las cuotas de interés, como la función (solicitudes para generar contenido) y la región.
Por ejemplo, para ver las cuotas por usuario para generar solicitudes de contenido en cualquiera de las regiones asiáticas admitidas, tu filtro se vería de la siguiente manera:
Generate content requests
+Dimension:region:asia
Selecciona la casilla de verificación a la izquierda de cada cuota que te interese.
Al final de la fila de la cuota, haz clic en
y, luego, selecciona Editar cuota.En el formulario Cambios de la cuota, haz lo siguiente:
Ingresa la cuota aumentada en el campo Valor nuevo.
Esta cuota se aplica a nivel del proyecto y se comparte entre todas las aplicaciones y direcciones IP que usan ese proyecto de Firebase.
Completa los campos adicionales del formulario y, luego, haz clic en LISTO.
Haz clic en Enviar solicitud.