Ограничения и квоты ставок

Щелкните своего поставщика API Gemini , чтобы просмотреть специфичный для этого поставщика контент и код на этой странице.


Ограничения скорости (обычно называемые квотами) регулируют количество запросов, которые вы можете сделать к API Gemini в течение определенного периода времени. Эти ограничения помогают обеспечить справедливое использование, защитить от злоупотреблений и поддерживать производительность системы для всех пользователей.

При использовании Firebase AI Logic для отправки запросов к моделям Gemini и Imagen , ограничения скорости вашего проекта зависят от выбранного вами поставщика " Gemini API ". Firebase AI Logic также предоставляет возможность устанавливать ограничения скорости "на пользователя" .

Посмотреть ограничения скорости для API разработчика Gemini

Как работают ограничения по ставкам (квоты)

Предельные значения ставок (квоты) измеряются по четырем параметрам:

  • Запросов в минуту (RPM)
  • Запросов в день (RPD)
  • Токенов в минуту (TPM)
  • Токенов в день (TPD)

Ваше использование оценивается по каждому лимиту, и превышение любого из них вызовет ошибку превышения квоты 429. Например, если ваш лимит RPM равен 20, то выполнение 21 запроса в течение минуты приведет к ошибке, даже если вы не превысили свой TPM или другие лимиты.

Ограничения скорости применяются на уровне проекта и распространяются на все приложения и IP-адреса, которые используют этот проект Firebase.

Ограничения различаются в зависимости от конкретной используемой модели, а некоторые ограничения применяются только к определенным моделям. Например, количество изображений в минуту (IPM) рассчитывается только для моделей, способных генерировать изображения ( Imagen 3 ), но концептуально похоже на TPM.

Для экспериментальных и предварительных моделей ограничения скорости более строгие.

Запросить увеличение лимита ставки

Если вы используете «платный уровень» API разработчика Gemini , вы можете запросить увеличение лимита скорости .

Установить ограничения скорости «на пользователя»

Для использования Firebase AI Logic в вашем проекте должен быть включен выбранный вами поставщик API Gemini , но вам также необходимо включить Firebase AI Logic API , который действует как шлюз между нашими клиентскими SDK и вашим поставщиком API Gemini . Этот API включается для вас при первоначальной настройке Firebase AI Logic в вашем проекте Firebase.

Вы можете использовать ограничение скорости (квоту) API Firebase AI Logic в качестве ограничения скорости "на пользователя" для вашего приложения , в частности для функций AI, которые полагаются на Firebase AI Logic . Вы должны установить это ограничение , чтобы разумно разместить одного пользователя, получающего доступ к вашим функциям AI, а также гарантировать, что ни один пользователь не превысит ограничения вашего поставщика API Gemini (который должен быть общим для всех ваших пользователей).

Подробная информация об ограничении скорости «на пользователя»

Вот некоторые важные сведения об ограничениях скорости (квотах) API Firebase AI Logic , в частности, о количестве запросов в минуту (RPM):

  • Он основан на принципе «Генерации запросов на контент» для каждого пользователя, каждого региона и на поминутной основе, а не на модели.

  • Он применяется на уровне проекта и распространяется на все приложения и IP-адреса, которые используют этот проект Firebase.

  • Он применяется к любому вызову, который исходит из любого Firebase AI Logic SDK.

  • Ограничение скорости по умолчанию составляет 100 об/мин на пользователя.
    Обратите внимание, что вам по-прежнему необходимо учитывать ограничения вашего поставщика API Gemini (см. выше), которые имеют приоритет над API Firebase AI Logic .

Отрегулируйте ограничение скорости «на пользователя»

Чтобы настроить ограничение скорости (квоту), необходимо иметь разрешение serviceusage.quotas.update , которое по умолчанию включено в роли владельца и редактора.

Вот как изменить лимит ставки (квоту) или запросить его увеличение:

  1. В консоли Google Cloud перейдите на страницу Firebase AI Logic API .

  2. Нажмите «Управление» .

  3. Ниже на странице нажмите вкладку Квоты и системные ограничения .

  4. Отфильтруйте таблицу, чтобы отобразить интересующие вас квоты, такие как возможности (запросы на создание контента) и регион.

    Например, чтобы просмотреть квоты для каждого пользователя на создание запросов контента в любом из поддерживаемых азиатских регионов, ваш фильтр будет выглядеть примерно так: Generate content requests + Dimension:region:asia

  5. Установите флажок слева от каждой интересующей квоты.

  6. В конце строки квоты нажмите , а затем выберите Изменить квоту .

  7. В форме «Изменение квоты» выполните следующие действия:

    1. Введите увеличенную квоту в поле Новое значение .

      Эта квота применяется на уровне проекта и распространяется на все приложения и IP-адреса, использующие этот проект Firebase.

    2. Заполните все дополнительные поля в форме и нажмите Готово .

    3. Нажмите «Отправить запрос» .