Klik penyedia Gemini API untuk melihat konten dan kode khusus penyedia di halaman ini. |
Batas kapasitas (biasanya disebut kuota) mengatur jumlah permintaan yang dapat Anda buat ke Gemini API dalam jangka waktu tertentu. Batas ini membantu memastikan penggunaan yang adil, melindungi dari penyalahgunaan, dan membantu mempertahankan performa sistem untuk semua pengguna.
Saat menggunakan Firebase AI Logic untuk mengirim permintaan ke model Gemini dan Imagen, batas kapasitas project Anda bergantung pada penyedia "Gemini API" yang Anda pilih. Firebase AI Logic juga menyediakan cara untuk menetapkan batas kapasitas "per pengguna".
Melihat batas kapasitas untuk Gemini Developer API
Cara kerja batas kapasitas (kuota)
Batas kapasitas (kuota) diukur di empat dimensi:
- Permintaan per menit (RPM)
- Permintaan per hari (RPD)
- Token per menit (TPM)
- Token per hari (TPD)
Penggunaan Anda dievaluasi berdasarkan setiap batas, dan jika melebihi salah satunya, error kuota terlampaui 429 akan dipicu. Misalnya, jika batas RPM Anda adalah 20, maka membuat 21 permintaan dalam satu menit akan mengakibatkan error, meskipun Anda belum melampaui TPM atau batas lainnya.
Batas kapasitas diterapkan di tingkat project dan berlaku untuk semua aplikasi dan alamat IP yang menggunakan project Firebase tersebut.
Batas bervariasi bergantung pada model tertentu yang digunakan, dan beberapa batas hanya berlaku untuk model tertentu. Misalnya, gambar per menit (IPM) hanya dihitung untuk model yang mampu menghasilkan gambar (Imagen 3), tetapi secara konseptual mirip dengan TPM.
Batas kapasitas lebih dibatasi untuk model eksperimental dan pratinjau.
Meminta peningkatan batas kapasitas
Jika menggunakan "paket berbayar" untuk Gemini Developer API, Anda dapat meminta peningkatan batas kapasitas.
Menetapkan batas kapasitas "per pengguna"
Untuk menggunakan Firebase AI Logic, project Anda harus mengaktifkan penyedia Gemini API yang dipilih, tetapi Anda juga harus mengaktifkan Firebase AI Logic API, yang berfungsi sebagai gateway antara SDK klien kami dan penyedia Gemini API Anda. API ini diaktifkan untuk Anda saat pertama kali menyiapkan Firebase AI Logic di project Firebase.
Anda dapat menggunakan batas kapasitas (kuota) API Firebase AI Logic sebagai batas kapasitas "per pengguna" untuk aplikasi Anda, khususnya untuk fitur AI yang mengandalkan Firebase AI Logic. Anda harus menetapkan batas ini untuk mengakomodasi satu pengguna yang mengakses fitur AI Anda secara wajar, sekaligus memastikan bahwa tidak ada satu pengguna pun yang melampaui batas penyedia Gemini API Anda (yang dimaksudkan untuk dibagikan oleh semua pengguna Anda).
Detail tentang batas kapasitas "per pengguna"
Berikut adalah beberapa detail penting tentang batas kapasitas (kuota) API Firebase AI Logic, yaitu permintaan per menit (RPM):
Hal ini didasarkan pada "Buat permintaan konten" berdasarkan per pengguna per region per menit, dan tidak didasarkan pada model.
Kebijakan ini berlaku di tingkat project dan berlaku untuk semua aplikasi dan alamat IP yang menggunakan project Firebase tersebut.
Hal ini berlaku untuk panggilan apa pun yang secara khusus berasal dari SDK Firebase AI Logic.
Batas kapasitas default adalah 100 RPM per pengguna.
Perhatikan bahwa Anda masih perlu mempertimbangkan batas untuk penyedia Gemini API (lihat di atas), yang lebih diutamakan daripada Firebase AI Logic API.
Menyesuaikan batas kapasitas "per pengguna"
Untuk menyesuaikan batas kapasitas (kuota), Anda harus memiliki izin serviceusage.quotas.update
, yang disertakan secara default dalam peran Pemilik dan Editor.
Berikut cara mengedit batas kapasitas (kuota) atau meminta penambahan:
Di konsol Google Cloud, buka halaman untuk Firebase AI Logic API.
Klik Manage.
Di bagian bawah halaman, klik tab Quotas & System Limits.
Filter tabel untuk menampilkan kuota minat, seperti kemampuan (permintaan untuk membuat konten) dan wilayah.
Misalnya, untuk melihat kuota per pengguna guna membuat permintaan konten di salah satu wilayah Asia yang didukung, filter Anda akan terlihat mirip dengan ini:
Generate content requests
+Dimension:region:asia
Pilih kotak centang di sebelah kiri setiap kuota yang diinginkan.
Di akhir baris kuota, klik
, lalu pilih Edit kuota.Di formulir Perubahan kuota, lakukan hal berikut:
Masukkan penambahan kuota di kolom Nilai baru.
Kuota ini berlaku di tingkat project dan digunakan bersama oleh semua aplikasi dan alamat IP yang menggunakan project Firebase tersebut.
Lengkapi kolom tambahan apa pun di formulir, lalu klik Selesai.
Klik Kirim permintaan.