按一下您的 Gemini API 供應商,即可在本頁查看供應商專屬內容和程式碼。 |
頻率限制 (通常稱為配額) 會限制您在指定時間範圍內向 Gemini API 提出的要求數量。這些限制有助於確保公平使用、防止濫用行為,並協助維持所有使用者的系統效能。
使用 Firebase AI Logic 將要求傳送至 Gemini 和 Imagen 模型時,專案的頻率限制取決於您選擇的「Gemini API」供應商。Firebase AI Logic 也提供一種設定「個別使用者」頻率限制的方法。
頻率限制 (配額) 的運作方式
速率限制 (配額) 會根據四個維度進行評估:
- 每分鐘要求次數 (RPM)
- 每日要求配額 (RPD)
- 每分鐘符號數 (TPM)
- 每日符記 (TPD)
系統會根據各項限制評估您的用量,如果超出任何限制,就會觸發 429 超出配額錯誤。舉例來說,如果 RPM 限制為 20,在 1 分鐘內提出 21 項要求會導致錯誤,即使您並未超出 TPM 或其他限制也一樣。
頻率限制會套用至專案層級,並套用至使用該 Firebase 專案的所有應用程式和 IP 位址。
限制會因所使用的特定模型而異,部分限制僅適用於特定模型。舉例來說,每分鐘圖片數 (IPM) 只會針對可產生圖片的模型 (Imagen 3) 計算,但概念上與每分鐘圖片數相似。
實驗版和預先發布版模型的頻率限制更為嚴格。
要求提高頻率限制
如果您使用的是 Gemini Developer API 的「付費層級」,可以要求提高頻率限制。
設定「每位使用者」的頻率限制
如要使用 Firebase AI Logic,您的專案必須啟用所選 Gemini API 提供者,但您也需要啟用 Firebase AI Logic API,這會做為用戶端 SDK 和 Gemini API 提供者之間的閘道。您在 Firebase 專案中初次設定 Firebase AI Logic 時,系統會為您啟用這個 API。
您可以使用 Firebase AI Logic API 頻率限制 (配額) 做為應用程式的「個別使用者」頻率限制,特別是依賴 Firebase AI Logic 的 AI 功能。您應設定此限制,讓單一使用者能合理地存取 AI 功能,同時確保單一使用者不會超出 Gemini API 供應商的限制 (供應商的限制是供所有使用者共用)。
「每位使用者」頻率限制的詳細資訊
以下是 Firebase AI Logic API 速率限制 (配額) 的幾項重要細節,特別是每分鐘要求數 (RPM):
這項指標是根據「產生內容要求」計算,以每位使用者、每個區域和每分鐘為單位,且不以模型為依據。
這項設定會套用至專案層級,並套用至使用該 Firebase 專案的所有應用程式和 IP 位址。
適用於任何來自 Firebase AI Logic SDK 的呼叫。
預設的頻率限制為每位使用者 100 RPM。
請注意,您仍須考量 Gemini API 供應商的限制 (請見上文),這些限制優先於 Firebase AI Logic API。
調整「每位使用者」頻率限制
如要調整速率限制 (配額),您必須具備 serviceusage.quotas.update
權限,該權限預設會包含在擁有者和編輯者角色中。
如要編輯速率限制 (配額) 或申請提高配額,請按照下列步驟操作:
在 Google Cloud 控制台中,前往 Firebase AI Logic API 的頁面。
點選「管理」。
在頁面下方,按一下「配額與系統限制」分頁標籤。
篩選表格,即可顯示感興趣的配額,例如功能 (產生內容的要求) 和區域。
舉例來說,如要查看在任何支援的亞洲區域中產生內容要求的使用者配額,篩選器會類似以下:
Generate content requests
+Dimension:region:asia
勾選每個感興趣的配額左側的核取方塊。
在配額列的結尾按一下
,然後選取「編輯配額」。在「Quota changes」表單中,執行下列操作:
在「新值」欄位中輸入增加的配額。
這個配額適用於專案層級,且會與使用該 Firebase 專案的所有應用程式和 IP 位址共用。
填妥表單中任何其他欄位,然後按一下「Done」(完成)。
按一下 [提交要求]。