Nhấp vào nhà cung cấp Gemini API để xem nội dung và mã dành riêng cho nhà cung cấp trên trang này. |
Giới hạn tốc độ (thường gọi là hạn mức) điều chỉnh số lượng yêu cầu bạn có thể gửi đến Gemini API trong một khung thời gian nhất định. Các giới hạn này giúp đảm bảo việc sử dụng công bằng, ngăn chặn hành vi sai trái và giúp duy trì hiệu suất hệ thống cho tất cả người dùng.
Khi sử dụng Firebase AI Logic để gửi yêu cầu đến các mô hình Gemini và Imagen, giới hạn tốc độ của dự án phụ thuộc vào nhà cung cấp "Gemini API" mà bạn đã chọn. Firebase AI Logic cũng cung cấp một cách để đặt giới hạn tốc độ "trên mỗi người dùng".
Xem giới hạn tốc độ cho Gemini Developer API
Cách hoạt động của giới hạn tốc độ (hạn mức)
Giới hạn tốc độ (hạn mức) được đo lường trên 4 phương diện:
- Số yêu cầu mỗi phút (RPM)
- Số yêu cầu mỗi ngày (RPD)
- Số mã thông báo mỗi phút (TPM)
- Số mã thông báo mỗi ngày (TPD)
Mức sử dụng của bạn được đánh giá theo từng hạn mức và việc vượt quá bất kỳ hạn mức nào sẽ kích hoạt lỗi 429: vượt quá hạn mức. Ví dụ: nếu giới hạn RPM của bạn là 20, thì việc tạo 21 yêu cầu trong vòng một phút sẽ dẫn đến lỗi, ngay cả khi bạn chưa vượt quá TPM hoặc các giới hạn khác.
Giới hạn tốc độ được áp dụng ở cấp dự án và áp dụng cho tất cả ứng dụng và địa chỉ IP sử dụng dự án Firebase đó.
Các giới hạn sẽ khác nhau tuỳ thuộc vào mô hình cụ thể đang được sử dụng và một số giới hạn chỉ áp dụng cho một số mô hình cụ thể. Ví dụ: số hình ảnh/phút (IPM) chỉ được tính cho các mô hình có thể tạo hình ảnh (Imagen 3), nhưng về mặt khái niệm thì tương tự như TPM.
Giới hạn tốc độ sẽ bị hạn chế hơn đối với các mô hình thử nghiệm và dùng thử.
Yêu cầu tăng giới hạn tốc độ yêu cầu
Nếu đang sử dụng "cấp có tính phí" cho Gemini Developer API, thì bạn có thể yêu cầu tăng giới hạn tỷ lệ.
Đặt hạn mức tốc độ "trên mỗi người dùng"
Để sử dụng Firebase AI Logic, dự án của bạn cần bật nhà cung cấp Gemini API mà bạn đã chọn, nhưng bạn cũng cần bật Firebase AI Logic API. API này đóng vai trò là cổng giữa SDK ứng dụng của chúng tôi và nhà cung cấp Gemini API của bạn. API này được bật cho bạn khi bạn thiết lập Firebase AI Logic ban đầu trong dự án Firebase.
Bạn có thể sử dụng hạn mức tỷ lệ (hạn mức) API Firebase AI Logic làm hạn mức tỷ lệ "trên mỗi người dùng" cho ứng dụng của mình, cụ thể là cho các tính năng AI dựa trên Firebase AI Logic. Bạn nên đặt giới hạn này để phù hợp với việc một người dùng truy cập vào các tính năng AI của bạn, đồng thời đảm bảo rằng không có người dùng nào vượt quá giới hạn của nhà cung cấp Gemini API (được tất cả người dùng chia sẻ).
Thông tin chi tiết về giới hạn tốc độ "trên mỗi người dùng"
Sau đây là một số thông tin quan trọng về hạn mức tốc độ (hạn mức) của API Firebase AI Logic, cụ thể là số yêu cầu mỗi phút (RPM):
Số liệu này dựa trên "Số yêu cầu tạo nội dung" trên mỗi người dùng, mỗi khu vực và mỗi phút, chứ không dựa trên mô hình.
Chính sách này áp dụng ở cấp dự án và áp dụng cho tất cả ứng dụng và địa chỉ IP sử dụng dự án Firebase đó.
Phương thức này áp dụng cho mọi lệnh gọi đến từ bất kỳ SDK Firebase AI Logic nào.
Giới hạn tốc độ mặc định là 100 RPM cho mỗi người dùng.
Xin lưu ý rằng bạn vẫn cần cân nhắc các giới hạn cho nhà cung cấp Gemini API (xem ở trên), các giới hạn này được ưu tiên hơn API Firebase AI Logic.
Điều chỉnh hạn mức tốc độ "trên mỗi người dùng"
Để điều chỉnh giới hạn tốc độ (hạn mức), bạn phải có quyền serviceusage.quotas.update
. Quyền này được đưa vào theo mặc định trong vai trò Chủ sở hữu và Người chỉnh sửa.
Dưới đây là cách chỉnh sửa hạn mức tốc độ (hạn mức) hoặc yêu cầu tăng hạn mức:
Trong bảng điều khiển Google Cloud, hãy chuyển đến trang của Firebase AI Logic API.
Nhấp vào Quản lý.
Ở phía dưới trang, hãy nhấp vào thẻ Hạn mức và giới hạn hệ thống.
Lọc bảng để hiển thị các hạn mức mà bạn quan tâm, chẳng hạn như chức năng (yêu cầu tạo nội dung) và khu vực.
Ví dụ: để xem hạn mức trên mỗi người dùng để tạo yêu cầu nội dung ở bất kỳ khu vực nào ở Châu Á được hỗ trợ, bộ lọc của bạn sẽ có dạng như sau:
Generate content requests
+Dimension:region:asia
Chọn hộp đánh dấu ở bên trái của từng hạn mức quan tâm.
Ở cuối hàng của hạn mức, hãy nhấp vào biểu tượng
, sau đó chọn Chỉnh sửa hạn mức.Trong biểu mẫu Thay đổi hạn mức, hãy làm như sau:
Nhập hạn mức tăng lên trong trường Giá trị mới.
Hạn mức này áp dụng ở cấp dự án và được chia sẻ trên tất cả ứng dụng và địa chỉ IP sử dụng dự án Firebase đó.
Điền vào mọi trường bổ sung trong biểu mẫu, rồi nhấp vào Xong.
Nhấp vào Gửi yêu cầu.