Hạn mức và hạn mức về số lượng yêu cầu

Nhấp vào nhà cung cấp Gemini API để xem nội dung và mã dành riêng cho nhà cung cấp trên trang này.


Hạn mức tỷ lệ (thường được gọi là hạn mức) điều chỉnh số lượng yêu cầu mà bạn có thể gửi đến Gemini API trong một khung thời gian nhất định. Các giới hạn này giúp đảm bảo việc sử dụng hợp lý, ngăn chặn hành vi sai trái và giúp duy trì hiệu suất hệ thống cho tất cả người dùng.

Khi sử dụng Firebase AI Logic để gửi yêu cầu đến các mô hình GeminiImagen, hạn mức yêu cầu của dự án sẽ phụ thuộc vào nhà cung cấp "Gemini API" mà bạn chọn. Firebase AI Logic cũng cung cấp một cách để đặt giới hạn về tốc độ "cho mỗi người dùng".

Xem hạn mức yêu cầu cho Gemini Developer API

Cách hoạt động của hạn mức (hạn mức sử dụng)

Giới hạn về tốc độ (hạn mức) được đo lường theo 4 phương diện:

  • Số yêu cầu mỗi phút (RPM)
  • Số yêu cầu mỗi ngày (RPD)
  • Số mã thông báo mỗi phút (TPM)
  • Số mã thông báo mỗi ngày (TPD)

Mức sử dụng của bạn được đánh giá dựa trên từng hạn mức và việc vượt quá bất kỳ hạn mức nào trong số đó sẽ kích hoạt lỗi 429 vượt quá hạn mức. Ví dụ: nếu giới hạn RPM của bạn là 20, thì việc thực hiện 21 yêu cầu trong vòng một phút sẽ dẫn đến lỗi, ngay cả khi bạn chưa vượt quá giới hạn TPM hoặc các giới hạn khác.

Giới hạn về tốc độ được áp dụng ở cấp dự án và áp dụng cho tất cả các ứng dụng và địa chỉ IP sử dụng dự án Firebase đó.

Hạn mức sẽ khác nhau tuỳ thuộc vào mô hình cụ thể đang được sử dụng và một số hạn mức chỉ áp dụng cho một số mô hình cụ thể. Ví dụ: số hình ảnh mỗi phút (IPM) chỉ được tính cho các mô hình có khả năng tạo hình ảnh (Imagen 3), nhưng về cơ bản thì tương tự như TPM.

Các mô hình thử nghiệm và mô hình xem trước có giới hạn về tốc độ nghiêm ngặt hơn.

Yêu cầu tăng giới hạn tốc độ

Nếu đang sử dụng "gói có tính phí" cho Gemini Developer API, thì bạn có thể yêu cầu tăng hạn mức sử dụng.

Đặt hạn mức "cho mỗi người dùng"

Để sử dụng Firebase AI Logic, dự án của bạn cần bật nhà cung cấp Gemini API mà bạn đã chọn, nhưng bạn cũng cần bật API Firebase AI Logic. API này đóng vai trò là cổng kết nối giữa các SDK ứng dụng của chúng tôi và nhà cung cấp Gemini API của bạn. API này sẽ được bật cho bạn khi bạn thiết lập Firebase AI Logic lần đầu trong dự án Firebase.

Bạn có thể sử dụng hạn mức tỷ lệ API (hạn mức) Firebase AI Logic làm hạn mức tỷ lệ "trên mỗi người dùng" cho ứng dụng của mình, cụ thể là đối với các tính năng AI dựa trên Firebase AI Logic. Bạn nên đặt giới hạn này để đáp ứng một cách hợp lý nhu cầu truy cập vào các tính năng AI của một người dùng, đồng thời đảm bảo rằng không có người dùng nào vượt quá giới hạn của nhà cung cấp Gemini API (được dùng chung cho tất cả người dùng).

Thông tin chi tiết về giới hạn tốc độ "mỗi người dùng"

Sau đây là một số thông tin quan trọng về hạn mức (hạn ngạch) API Firebase AI Logic – cụ thể là số yêu cầu mỗi phút (RPM):

  • Hạn mức này dựa trên "Yêu cầu tạo nội dung" theo từng người dùng, từng khu vực và từng phút, đồng thời không dựa trên mô hình.

  • Quy tắc này áp dụng ở cấp dự án và áp dụng cho tất cả các ứng dụng và địa chỉ IP sử dụng dự án Firebase đó.

  • Quy tắc này áp dụng cho mọi lệnh gọi cụ thể đến từ bất kỳ SDK Firebase AI Logic nào.

  • Giới hạn tốc độ mặc định là 100 RPM cho mỗi người dùng.
    Xin lưu ý rằng bạn vẫn cần cân nhắc các giới hạn cho trình cung cấp Gemini API (xem ở trên), các giới hạn này sẽ được ưu tiên hơn API Firebase AI Logic.

Điều chỉnh giới hạn về tốc độ "cho mỗi người dùng"

Để điều chỉnh hạn mức, bạn phải có quyền serviceusage.quotas.update. Theo mặc định, quyền này được cấp cho vai trò Chủ sở hữu và Người chỉnh sửa.

Dưới đây là cách chỉnh sửa hạn mức (hạn ngạch) hoặc yêu cầu tăng hạn mức:

  1. Trong bảng điều khiển Google Cloud, hãy chuyển đến trang dành cho Firebase AI Logic API.

  2. Nhấp vào Quản lý.

  3. Ở phía dưới trang, hãy nhấp vào thẻ Hạn mức và giới hạn hệ thống.

  4. Lọc bảng để cho thấy những hạn mức bạn quan tâm, chẳng hạn như khả năng (yêu cầu tạo nội dung) và khu vực.

    Ví dụ: để xem hạn mức cho mỗi người dùng đối với việc tạo yêu cầu tạo nội dung ở bất kỳ khu vực nào được hỗ trợ tại Châu Á, bộ lọc của bạn sẽ có dạng như sau: Generate content requests + Dimension:region:asia

  5. Chọn hộp đánh dấu ở bên trái của từng hạn mức mà bạn quan tâm.

  6. Ở cuối hàng của hạn mức, hãy nhấp vào biểu tượng , rồi chọn Chỉnh sửa hạn mức.

  7. Trong biểu mẫu Thay đổi hạn mức, hãy làm như sau:

    1. Nhập hạn mức mới vào trường Giá trị mới.

      Hạn mức này áp dụng ở cấp dự án và được chia sẻ trên tất cả các ứng dụng và địa chỉ IP sử dụng dự án Firebase đó.

    2. Điền vào các trường khác trong biểu mẫu, rồi nhấp vào Xong.

    3. Nhấp vào Gửi yêu cầu.