Limity i kwoty

Kliknij dostawcę Gemini API, aby wyświetlić na tej stronie treści i kod związane z tym dostawcą.


Limity częstotliwości (zwane też limitami) określają liczbę żądań, które możesz wysyłać do Gemini API w określonym przedziale czasu. Te limity pomagają zapewnić uczciwe korzystanie z usługi, chronią przed nadużywaniem i pomagają utrzymać wydajność systemu dla wszystkich użytkowników.

Gdy używasz usługi Firebase AI Logic do wysyłania żądań do modeli GeminiImagen, limity szybkości projektu zależą od wybranego dostawcy usługi Gemini API. Firebase AI Logic umożliwia też ustawianie limitów szybkości „na użytkownika”.

Wyświetlanie limitów stawek w przypadku Gemini Developer API

Jak działają limity szybkości (kwoty)

Limity szybkości (kwoty) są mierzone w 4 wymiarach:

  • Żądania na minutę (RPM)
  • Żądania dziennie (RPD)
  • Tokeny na minutę (TPM)
  • Tokeny dziennie (TPD)

Twoje wykorzystanie jest oceniane na podstawie każdego limitu, a przekroczenie któregokolwiek z nich spowoduje błąd 429 o przekroczeniu limitu. Jeśli np. Twój limit RPM wynosi 20, wysłanie 21 zapytań w ciągu minuty spowoduje błąd, nawet jeśli nie przekroczysz limitu TPM ani innych limitów.

Limity szybkości są stosowane na poziomie projektu i dotyczą wszystkich aplikacji oraz adresów IP, które korzystają z tego projektu Firebase.

Limity różnią się w zależności od konkretnego modelu, a niektóre z nich dotyczą tylko określonych modeli. Na przykład liczba obrazów na minutę (IPM) jest obliczana tylko w przypadku modeli zdolnych do generowania obrazów (Imagen 3), ale pod względem koncepcyjnym jest podobna do TPM.

Limity szybkości są bardziej restrykcyjne w przypadku modeli eksperymentalnych i wersji testowych.

Wysyłanie prośby o zwiększenie limitu częstotliwości

Jeśli korzystasz z poziomu płatnego usługi Gemini Developer API, możesz poprosić o zwiększenie limitu stawki.

Ustawianie limitów szybkości „na użytkownika”

Aby korzystać z Firebase AI Logic, musisz mieć włączonego wybranego dostawcę Gemini API, ale musisz też włączyć interfejs Firebase AI Logic API, który działa jako brama między naszymi pakietami SDK klienta a dostawcą Gemini API. Ten interfejs API jest włączony podczas początkowej konfiguracji Firebase AI Logic w projekcie Firebase.

Limit częstotliwości wywołań interfejsu API (limitu) Firebase AI Logic możesz użyć jako limitu częstotliwości „na użytkownika” w przypadku aplikacji, zwłaszcza w przypadku funkcji AI, które korzystają z Firebase AI Logic. Ustaw ten limit tak, aby uwzględnić uzasadnione potrzeby jednego użytkownika korzystającego z funkcji AI, a zarazem zadbać o to, aby żaden użytkownik nie przekraczał limitów dostawcy Gemini API (które są przeznaczone do współdzielenia przez wszystkich użytkowników).

Szczegóły dotyczące limitu szybkości „na użytkownika”

Oto kilka ważnych informacji o limitach (kwotach) szybkości interfejsu Firebase AI LogicAPI – w szczególności o liczbach żądań na minutę (RPM):

  • Jest ona obliczana na podstawie „generowania żądań treści” na użytkownika i region na minutę i nie opiera się na modelu.

  • Ma on zastosowanie na poziomie projektu i dotyczy wszystkich aplikacji oraz adresów IP, które korzystają z tego projektu Firebase.

  • Dotyczy to każdego wywołania pochodzącego z dowolnego Firebase AI LogicSDK.

  • Domyślny limit stawki to 100 RPM na użytkownika.
    Pamiętaj, że musisz też wziąć pod uwagę limity dostawcy Gemini API (patrz wyżej), które mają pierwszeństwo przed interfejsem API Firebase AI Logic.

Dostosowywanie limitu szybkości „na użytkownika”

Aby zmienić limit szybkości (kwotę), musisz mieć uprawnienie serviceusage.quotas.update, które jest domyślnie zawarte w roli Właściciel i Edytujący.

Aby edytować limit stawek (kwotę) lub poprosić o jego zwiększenie:

  1. W konsoli Google Cloud otwórz stronę interfejsu Firebase AI Logic API.

  2. Kliknij Zarządzaj.

  3. Dalej na stronie kliknij kartę Limity przydziału i limity systemu.

  4. Przefiltruj tabelę, aby wyświetlić interesujące Cię limity, np. możliwości (zapytania o generowanie treści) i region.

    Aby na przykład wyświetlić limity na użytkownika dotyczące generowania próśb o treści w dowolnym z obsługiwanych regionów azjatyckich, filtr powinien wyglądać tak: Generate content requests + Dimension:region:asia

  5. Zaznacz pole wyboru po lewej stronie każdego limitu, który Cię interesuje.

  6. Na końcu wiersza limitu kliknij , a następnie wybierz Edytuj limit.

  7. W formularzu Zmiany limitów:

    1. W polu Nowa wartość wpisz zwiększony limit.

      Ta pula jest stosowana na poziomie projektu i jest udostępniana wszystkim aplikacjom i adresom IP, które korzystają z tego projektu Firebase.

    2. Wypełnij wszelkie dodatkowe pola w formularzu i kliknij Gotowe.

    3. Kliknij Prześlij prośbę.