速率限制和配额

点击您的 Gemini API 提供商,在本页面上查看特定于提供商的内容和代码。


速率限制(通常称为配额)用于规范您在给定时间段内可以向 Gemini API 发出的请求数量。这些限制有助于确保公平使用、防范滥用行为,并帮助维护所有用户的系统性能。

使用 Firebase AI LogicGeminiImagen 模型发送请求时,项目的速率限制取决于您选择的“Gemini API”提供程序。Firebase AI Logic 还提供了一种设置“每位用户”速率限制的方法。

查看 Gemini Developer API 的速率限制

速率限制(配额)的运作方式

速率限制(配额)是根据以下四个维度衡量的:

  • 每分钟请求数 (RPM)
  • 每天的请求次数 (RPD)
  • 每分钟令牌数 (TPM)
  • 每天的令牌数 (TPD)

系统会根据每个限制对您的用量进行评估,如果超出其中任何一个限制,都会触发 429 配额超出错误。例如,如果您的 RPM 限制为 20,那么在一分钟内发出 21 个请求将导致错误,即使您没有超出 TPM 或其他限制也是如此。

速率限制在项目一级应用,适用于使用该 Firebase 项目的所有应用和 IP 地址。

限制因所使用的具体模型而异,有些限制仅适用于特定模型。例如,“每分钟图片数”(IPM) 仅针对能够生成图片的模型 (Imagen 3) 计算,但在概念上与 TPM 类似。

实验性模型和预览版模型的速率限制更为严格。

申请提高速率限制

如果您使用的是 Gemini Developer API 的“付费层级”,则可以申请提高速率限制

设置“每位用户”速率限制

如需使用 Firebase AI Logic,您的项目需要启用您选择的 Gemini API 提供方,但您还需要启用 Firebase AI Logic API,它充当我们客户端 SDK 和您的 Gemini API 提供方之间的网关。当您在 Firebase 项目中首次设置 Firebase AI Logic 时,系统会为您启用此 API。

您可以将 Firebase AI Logic API 速率限制(配额)用作应用的“每位用户”速率限制,尤其是对于依赖于 Firebase AI Logic 的 AI 功能。您应设置此限制,以合理地容纳单个用户访问您的 AI 功能,同时确保任何单个用户都不会超出 Gemini API 提供商的限制(该限制是供所有用户共享的)。

“每位用户”速率限制的详细信息

以下是有关 Firebase AI Logic API 速率限制(配额)的一些重要详细信息,具体而言是每分钟请求数 (RPM):

  • 此配额基于“生成内容请求”的每位用户每分钟每区域数,而非基于模型。

  • 此角色在项目级应用,适用于使用该 Firebase 项目的所有应用和 IP 地址。

  • 它适用于明确来自任何 Firebase AI Logic SDK 的任何调用。

  • 默认速率限制为每位用户 100 RPM。
    请注意,您仍需要考虑 Gemini API 提供程序的限制(见上文),这些限制优先于 Firebase AI Logic API。

调整“每位用户”速率限制

如需调整速率限制(配额),您必须拥有 serviceusage.quotas.update 权限,该权限默认包含在 Owner 和 Editor 角色中。

如需修改速率限制(配额)或申请增加配额,请按以下步骤操作:

  1. Google Cloud 控制台中,前往 Firebase AI Logic API 的页面。

  2. 点击管理

  3. 在页面下方,点击配额和系统限制标签页。

  4. 过滤表格以显示您感兴趣的配额,例如 capability(生成内容的请求)和区域。

    例如,如需查看在任何受支持的亚洲地区生成内容请求的每位用户配额,您的过滤条件将如下所示:Generate content requests + Dimension:region:asia

  5. 选中您要查看的每个配额左侧的复选框。

  6. 点击配额行末尾的 ,然后选择修改配额

  7. 配额更改表单中,执行以下操作:

    1. 新值字段中输入增加的配额。

      此配额在项目一级应用,并由使用该 Firebase 项目的所有应用和 IP 地址共享。

    2. 填写表单中的任何其他字段,然后点击完成

    3. 点击提交请求