The latest Gemini models, like Gemini 3.6 Flash, are available to use with Firebase AI Logic! Learn more.

All Imagen models will shut down as early as June 30, 2026. Learn about migrating your apps to use Nano Banana.

Gemini 2.5 models will shut down in October 2026. To avoid service disruptions, update to a newer model (like gemini-3.6-flash or gemini-3.1-flash-image). Any stable Gemini Live API 2.5 models are not impacted. Learn more.

Google 会使用 AI 技术将内容翻译成您偏好的语言。AI 翻译可能包含错误。

速率限制和配额

点击您的 Gemini API 提供商，以查看此页面上特定于提供商的内容和代码。

速率限制（通常称为配额）用于规范您在给定时间段内可以向 Gemini API 发出的请求数量。这些限制有助于确保公平使用、防范滥用行为，并帮助所有用户维持系统性能。

使用 Firebase AI Logic 向 Gemini 和 Imagen 模型发送请求时，项目的速率限制取决于您选择的 “Gemini API”提供商。Firebase AI Logic 还提供了一种设置“每位用户”速率限制的方法。

查看 Gemini Developer API 的速率限制

如果超出配额，或者您访问的模型的容量已用尽，则会收到 429 错误消息 。

速率限制（配额）的运作方式

速率限制（配额）按以下四个维度衡量：

每分钟请求数 (RPM)
每日请求数 (RPD)
每分钟 token 数 (TPM)
每日 token 数 (TPD)

系统会根据每个限制评估您的用量，超出任何限制都会触发 429 超出配额错误。例如，如果您的 RPM 限制为 20，那么在一分钟内发出 21 个请求会导致错误，即使您没有超出 TPM 或其他限制也是如此。

速率限制在项目级应用，适用于使用该 Firebase 项目的所有应用和 IP 地址。

限制因所使用的特定模型而异，并且某些限制仅适用于特定模型。例如，每分钟图片数 (IPM) 仅针对能够生成图片 (Imagen) 的模型计算，但在概念上与 TPM 类似。

对于实验性模型和预览版模型，速率限制更为严格。

申请提高速率限制

如果您使用的是 Gemini Developer API 的“付费层级”，则可以申请提高速率限制。

设置“每位用户”速率限制

如需使用 Firebase AI Logic，您的项目需要启用您选择的 Gemini API 提供商，但您还需要启用 Firebase AI Logic API，该 API 充当客户端 SDK 和您的 Gemini API 提供商之间的网关。当您在 Firebase 项目中首次设置 Firebase AI Logic时，系统会为您启用此 API。

您可以将 Firebase AI Logic API 速率限制（配额）用作应用的 “每位用户”速率限制，特别是对于依赖于 Firebase AI Logic 的 AI 功能。您应设置此限制，以便合理地容纳单个用户访问您的 AI 功能，同时确保没有单个用户超出您的 Gemini API 提供商的限制（该限制旨在供所有用户共享）。

有关“每位用户”速率限制的详细信息

以下是有关 Firebase AI Logic API 速率限制（配额）的一些重要详细信息，特别是每分钟请求数 (RPM)：

它基于“生成内容请求”，按每位用户、每个区域、每分钟计算，并且不基于模型。
它是应用于所有用户的速率限制。目前，无法为特定用户或特定用户群组设置速率限制^*。
它在项目级应用，适用于使用该 Firebase 项目的所有应用和 IP 地址。
它适用于专门来自任何 Firebase AI Logic SDK 的任何调用。
默认速率限制为每位用户 100 RPM。
请注意，您仍需考虑您的 Gemini API 提供商的限制（见上文），这些限制优先于 Firebase AI Logic API。

^{* 如果您使用的是 Vertex AI Gemini API，并且您的
应用将用户定向到不同的区域（例如，使用
Firebase Remote Config），
那么您可以为特定区域的用户设置特定的速率限制。}

调整“每位用户”速率限制

如需调整速率限制（配额），您必须拥有 serviceusage.quotas.update 权限，该权限默认包含在 Owner 和 Editor 角色中。

以下介绍了如何修改速率限制（配额）或申请提高速率限制：

在 Google Cloud 控制台中，前往 Firebase AI Logic API 的页面。
点击管理。
在页面下方，点击配额和系统限制 标签页。
过滤表格以显示您感兴趣的配额，例如功能（生成内容的请求）和区域。

例如，如需查看任何受支持的亚洲区域中生成内容请求的每位用户配额，您的过滤条件将类似于以下内容：Generate content requests + Dimension:region:asia

注意：如需创建 Dimension 过滤条件，您需要使用过滤条件工具，而不是仅复制并粘贴上述示例中的值。此外，(default) 配额行不适用于 Firebase AI Logic。
选中您感兴趣的每个配额左侧的复选框。
在配额行的末尾，点击 , 然后选择 修改配额。
在配额更改 表单中，执行以下操作：
1. 在新值字段中输入增加的配额。
  
  此配额在项目级应用，适用于使用该 Firebase 项目的所有应用和 IP 地址。
2. 填写表单中的任何其他字段，然后点击完成。
3. 点击提交请求 。