Untuk aplikasi seluler dan web, SDK Firebase AI Logic memungkinkan Anda berinteraksi dengan model Gemini dan model Imagen 3 yang didukung langsung dari aplikasi Anda.
Model Gemini dianggap multimodal karena mampu memproses dan bahkan menghasilkan beberapa modalitas, termasuk teks, kode, PDF, gambar, video, dan audio. Model Imagen 3 dapat diminta dengan teks untuk membuat gambar.
Tabel berikut adalah ringkasan singkat model yang didukung untuk Firebase AI Logic dan nama model stabil terbarunya. Tabel ini juga mencantumkan pratinjau dan model eksperimental yang tersedia untuk membuat prototipe kasus penggunaan.
Model | Input | Output | Deskripsi |
---|---|---|---|
Model Gemini dengan versi stabil | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
teks, kode, PDF, gambar, video, audio | teks, kode, JSON (gambar & audio segera hadir!) |
Model multimodal kami dengan fitur generasi berikutnya dan kemampuan yang ditingkatkan, termasuk kecepatan yang unggul, penggunaan alat bawaan, dan jendela konteks 1 juta token (pembuatan multimodal segera hadir!) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
teks, kode, PDF, gambar, video, audio | teks, kode, JSON | Model Flash tercepat dan paling hemat biaya kami. Ini adalah jalur upgrade untuk pengguna 1.5 Flash yang menginginkan kualitas yang lebih baik dengan harga dan kecepatan yang sama. |
Model Gemini dengan pratinjau saja dan versi eksperimen (direkomendasikan hanya untuk kasus penggunaan pembuatan prototipe) | |||
Gemini 2.5 Progemini-2.5-pro-preview-05-06
|
teks, kode, PDF, gambar, video, audio | teks, kode, JSON | Model penalaran kami yang paling canggih, yang mampu menyelesaikan masalah kompleks. |
Gemini 2.5 Flashgemini-2.5-flash-preview-04-17
|
teks, kode, PDF, gambar, video, audio | teks, kode, JSON | Model pemikiran kami yang menawarkan kemampuan yang luar biasa dan menyeluruh. Layanan ini dirancang untuk menawarkan keseimbangan antara harga dan performa. |
Gemini 2.0 Flash‑Live 1gemini-2.0-flash-live-preview-04-09
|
teks (streaming), audio (streaming) |
teks (streaming), audio (streaming) |
Model multimodal kami yang mendukung streaming real-time berlatensi rendah untuk input dan output multimodal. |
Model Imagen 3 (saat menggunakan dengan Firebase AI Logic) | |||
Imagen 3imagen-3.0-generate-002 |
teks | gambar | Menghasilkan gambar realistis dan berkualitas tinggi dari perintah teks bahasa alami |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
teks | gambar | Membuat gambar untuk pembuatan prototipe atau kasus penggunaan latensi rendah |
1 Tidak didukung saat menggunakan Gemini Developer API
dengan SDK Firebase AI Logic.
2 Tidak didukung oleh Gemini Developer API, apa pun
cara Anda mengakses API.
Selain itu, tinjau FAQ kami tentang semua model yang didukung dan tidak didukung oleh Firebase AI Logic.
Bagian lain dari halaman ini memberikan informasi mendetail tentang model yang didukung oleh Firebase AI Logic.
-
- Input dan output yang didukung
- Perbandingan tingkat tinggi kemampuan yang didukung
- Spesifikasi dan batasan, misalnya token input maksimum atau durasi maksimum video input
Deskripsi cara model diberi versi, khususnya versi stabil, diupdate otomatis, pratinjau, dan eksperimental
Daftar nama model yang tersedia untuk disertakan dalam kode Anda selama inisialisasi
Daftar bahasa yang didukung untuk model
Di bagian bawah halaman ini, Anda dapat melihat informasi mendetail tentang model lama.
Bandingkan model
Setiap model memiliki kemampuan yang berbeda untuk mendukung berbagai kasus penggunaan. Perhatikan bahwa setiap tabel di bagian ini menjelaskan setiap model saat digunakan dengan Firebase AI Logic. Setiap model mungkin memiliki kemampuan tambahan yang tidak tersedia saat menggunakan SDK kami.
Jika tidak dapat menemukan informasi yang Anda cari di subbagian berikut, Anda dapat menemukan informasi selengkapnya dalam dokumentasi penyedia API yang dipilih:
Gemini Developer API: model Gemini dan model Imagen
Vertex AI Gemini API: model Gemini dan model Imagen
Input dan output yang didukung
Berikut adalah jenis input dan output yang didukung saat menggunakan setiap model dengan Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Flash Gemini 2.5 </span="notranslate"> |
<span="notranslate">Flash Gemini 2.0 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|||
---|---|---|---|---|---|---|---|---|
Jenis input | ||||||||
Teks | ||||||||
Teks (streaming) | ||||||||
Kode | ||||||||
Dokumen (PDF atau teks biasa) |
||||||||
Gambar | ||||||||
Video | ||||||||
Audio | ||||||||
Audio (streaming) | ||||||||
Jenis output | ||||||||
Teks | ||||||||
Teks (streaming) | ||||||||
Kode | ||||||||
Output terstruktur (seperti JSON) |
||||||||
Gambar | segera hadir! | |||||||
Audio | segera hadir! | |||||||
Audio (streaming) |
Untuk mempelajari jenis file yang didukung, lihat Persyaratan dan file input yang didukung.
Kemampuan dan fitur yang didukung
Berikut adalah kemampuan dan fitur yang didukung saat menggunakan setiap model dengan Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Flash Gemini 2.5 </span="notranslate"> |
<span="notranslate">Flash Gemini 2.0 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|
Membuat teks dari input khusus teks atau multimodal | streaming saja | |||||
Buat gambar (Imagen 3) |
segera hadir! | |||||
Membuat audio | segera hadir! | streaming saja | ||||
Buat
output terstruktur
(seperti JSON) |
||||||
Menganalisis dokumen
(PDF atau teks biasa) |
||||||
Menganalisis gambar (visi) | ||||||
Menganalisis video (visi) | ||||||
Menganalisis audio | streaming saja | |||||
Multi-turn chat | ||||||
Panggilan fungsi (alat) | ||||||
Token jumlah | ||||||
Petunjuk sistem | ||||||
Streaming multimodal dua arah |
Spesifikasi dan batasan
Berikut adalah spesifikasi dan batasan saat menggunakan setiap model dengan Firebase AI Logic:
Properti |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Flash Gemini 2.5 </span="notranslate"> |
<span="notranslate">Flash Gemini 2.0 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|---|
Jendela konteks * Total batas token (input+output gabungan) |
1.048.576 token | 1.048.576 token | 1.048.576 token | 1.048.576 token | 32.768 token | 480 token | |
Batas token output * | 65.536 token | 65.536 token | 8.192 token | 8.192 token | --- | --- | |
Tanggal batas informasi | Januari 2025 | Januari 2025 | Juni 2024 | Juni 2024 | Agustus 2024 | --- | |
PDF (sesuai permintaan) | |||||||
Jumlah maksimum file PDF input ** |
3.000 file | 3.000 file | 3.000 file | 3.000 file | --- | --- | |
Jumlah maksimum halaman per file PDF input ** |
1.000 halaman | 1.000 halaman | 1.000 halaman | 1.000 halaman | --- | --- | |
Ukuran maks. per file PDF input |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | |
Gambar (per permintaan) | |||||||
Jumlah maksimum gambar input |
3.000 gambar | 3.000 gambar | 3.000 gambar | 3.000 gambar | --- | --- | |
Jumlah maksimum gambar output |
--- | --- | segera hadir! | --- | --- | 4 gambar | |
Ukuran maksimum per gambar berenkode base64 input |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | |
Video (sesuai permintaan) | |||||||
Jumlah maksimum file video input |
10 file | 10 file | 10 file | 10 file | --- | --- | |
Panjang maksimum semua video input (hanya frame) |
~60 menit | ~60 menit | ~60 menit | ~60 menit | --- | --- | |
Panjang maksimum semua video input (frame+audio) |
~45 menit | ~45 menit | ~45 menit | ~45 menit | --- | --- | |
Audio (sesuai permintaan) | |||||||
Jumlah maksimum file audio input |
1 file | 1 file | 1 file | 1 file | --- | --- | |
Jumlah maksimum file audio output |
--- | --- | segera hadir! | --- | --- | --- | |
Panjang maksimum dari semua audio input |
~8,4 jam | ~8,4 jam | ~8,4 jam | ~8,4 jam | --- | --- | |
Panjang maksimum dari semua audio output |
--- | --- | segera hadir! | --- | --- | --- |
*
Untuk semua model Gemini, token setara dengan sekitar 4 karakter,
sehingga 100 token adalah sekitar 60-80 kata dalam bahasa Inggris. Untuk model Gemini, Anda dapat menentukan jumlah total token dalam permintaan menggunakan countTokens
.
** PDF diperlakukan sebagai gambar, sehingga satu halaman PDF diperlakukan sebagai satu gambar. Jumlah halaman yang diizinkan dalam permintaan dibatasi pada jumlah gambar yang dapat didukung model.
Menemukan informasi mendetail tambahan
Kuota dan harga berbeda untuk setiap model. Harga juga bergantung pada input dan output.
Pelajari jenis file input yang didukung, cara menentukan jenis MIME, dan cara memastikan bahwa file input dan permintaan multimodal Anda memenuhi persyaratan dan mengikuti praktik terbaik di Persyaratan dan file input yang didukung.
Pola penamaan dan pembuatan versi model
Model ditawarkan dalam versi stabil, pratinjau, dan eksperimental. Untuk kemudahan, alias tanpa nilai versi eksplisit didukung.
Untuk menemukan nama model tertentu yang akan digunakan dalam kode Anda, lihat bagian "nama model yang tersedia" nanti di halaman ini.
Jenis versi / Tahap rilis |
Deskripsi | Pola nama model | |
---|---|---|---|
Stabil |
Versi Stabil tersedia dan didukung
untuk penggunaan produksi mulai tanggal rilis.
Versi model stabil biasanya dirilis dengan tanggal penghentian, yang menunjukkan hari terakhir model tersedia. Setelah tanggal ini, model tidak dapat lagi diakses atau didukung oleh Google. |
Nama model versi stabil ditambahkan dengan nomor versi tiga digit tertentu
Contoh: |
|
Alias stabil yang diupdate otomatis | Alias stabil diupdate otomatis selalu mengarah ke versi stabil terbaru dari model tersebut. Jika versi stabil baru dirilis, alias diupdate otomatis akan otomatis mulai mengarah ke versi stabil baru tersebut. |
Nama model alias tidak memiliki imbuhan
Contoh: |
|
Pratinjau |
Versi Pratinjau memiliki kemampuan baru dan dianggap tidak stabil.
Versi pratinjau selalu mengarah ke versi pratinjau terbaru model tersebut. Jika versi pratinjau baru dirilis, versi pratinjau yang ada akan otomatis mulai mengarah ke versi pratinjau baru tersebut. Model ini tidak direkomendasikan untuk penggunaan produksi, dilengkapi dengan batas kapasitas yang lebih ketat, dan mungkin memiliki persyaratan penagihan. |
Nama model versi pratinjau ditambahkan dengan
Contoh: |
|
Eksperimental |
Versi Eksperimental memiliki kemampuan baru
dan dianggap tidak stabil.
Model ini tidak direkomendasikan untuk penggunaan produksi dan memiliki batas kapasitas yang lebih ketat. Model eksperimental ditujukan untuk mengumpulkan masukan dan memungkinkan eksperimen dengan fitur terbaru kami. |
Nama model versi eksperimental ditambahkan dengan
Contoh: |
|
Pensiunan |
Versi Tidak digunakan lagi telah melewati tanggal penghentiannya dan telah dinonaktifkan secara permanen.
Model yang tidak digunakan lagi tidak dapat diakses atau didukung oleh Google. Permintaan yang mereferensikan ID model yang tidak digunakan lagi biasanya menampilkan error 404. |
--- |
Nama model yang tersedia
Nama model adalah nilai eksplisit yang Anda sertakan dalam kode selama inisialisasi model.
Mencantumkan semua model yang tersedia secara terprogram
Anda dapat mencantumkan semua nama model yang tersedia menggunakan REST API:
Gemini Developer API: Memanggil endpoint
models.list
Vertex AI Gemini API: Memanggil endpoint
publishers.models.list
Perhatikan bahwa daftar yang ditampilkan ini akan menyertakan semua model yang didukung oleh penyedia API, tetapi Firebase AI Logic hanya mendukung model Gemini dan Imagen yang dijelaskan di halaman ini.
Perhatikan juga bahwa alias yang diperbarui secara otomatis (misalnya, gemini-2.0-flash
) tidak
tercantum karena merupakan alias praktis untuk model dasar.
Gemini nama model
Untuk contoh inisialisasi untuk platform Anda, lihat panduan memulai.
Untuk mengetahui detail tentang tahap rilis (terutama untuk kasus penggunaan dan penagihan), lihat pola penamaan dan pembuatan versi model.
Gemini 2.5 Pro nama model
Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
---|---|---|---|---|
gemini-2.5-pro-preview-05-06 |
Versi pratinjau Gemini 2.5 Pro | Pratinjau | 2025-05-06 | Belum ditentukan |
gemini-2.5-pro-preview-03-25 |
Versi pratinjau yang mengarah ke gemini-2.5-pro-preview-05-06 (yang merupakan versi pratinjau terbaru) |
Pratinjau | 25-03-2025 | Belum ditentukan |
Gemini 2.5 Flash nama model
Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
---|---|---|---|---|
gemini-2.5-flash-preview-04-17 |
Versi pratinjau Gemini 2.5 Flash | Pratinjau | 2025-04-17 | Belum ditentukan |
Gemini 2.0 Flash nama model
Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
---|---|---|---|---|
gemini-2.0-flash-001 |
Gemini 2.0 Flash versi stabil terbaru | Stabil | 2025-02-05 | Tidak lebih awal dari 05-02-2026 |
gemini-2.0-flash |
Alias yang diperbarui secara otomatis yang mengarah ke versi stabil terbaru Flash 2.0 (saat ini gemini-2.0-flash-001 |
Stabil | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite nama model
Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Gemini 2.0 Flash‑Lite versi stabil terbaru | Stabil | 2025-02-25 | Tidak lebih awal dari 25-02-2026 |
gemini-2.0-flash-lite |
Alias yang diperbarui secara otomatis yang mengarah ke versi stabil terbaru 2.0 Flash-Lite (saat ini gemini-2.0-flash-lite-001 |
Stabil | 2025-02-25 | --- |
Gemini 2.0 Flash‑Live nama model
Hanya tersedia saat menggunakan Vertex AI Gemini API sebagai penyedia API Anda. |
Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Versi pratinjau untuk Gemini 2.0 Flash‑Live | Pratinjau | 2025-04-09 | Belum ditentukan |
1 Tidak didukung saat menggunakan Gemini Developer API dengan SDK Firebase AI Logic.
Imagen nama model
Untuk contoh inisialisasi untuk platform Anda, lihat panduan membuat gambar dengan Imagen.
Untuk mengetahui detail tentang tahap rilis (terutama untuk kasus penggunaan dan penagihan), lihat pola penamaan dan pembuatan versi model.
Imagen 3 nama model
Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
---|---|---|---|---|
imagen-3.0-generate-002 |
Imagen 3 versi stabil terbaru | Stabil | 2025-01-23 | Tidak lebih awal dari 23-01-2026 |
imagen-3.0-generate-001 2 |
Versi stabil awal Imagen 3 | Stabil | 2024-07-31 | Tidak lebih awal dari 31-07-2025 |
Imagen 3 Fast nama model
Nama model | Deskripsi | Tahap rilis | Tanggal rilis | Tanggal penghentian |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Versi stabil awal Imagen 3 Fast | Stabil | 2024-07-31 | Tidak lebih awal dari 31-07-2025 |
2 Tidak didukung oleh Gemini Developer API, apa pun cara Anda mengakses API.
Bahasa yang didukung
Gemini
Semua model Gemini dapat memahami dan merespons dalam bahasa berikut:
Arab (ar), Bengali (bn), Bulgaria (bg), China sederhana dan tradisional (zh), Kroasia (hr), Ceko (cs), Denmark (da), Belanda (nl), Inggris (en), Estonia (et), Finlandia (fi), Prancis (fr), Jerman (de), Yunani (el), Ibrani (iw), Hindi (hi), Hungaria (hu), Indonesia (id), Italia (it), Jepang (ja), Korea (ko), Latvia (lv), Lituania (lt), Norwegia (no), Polandia (pl), Portugis (pt), Rumania (ro), Rusia (ru), Serbia (sr), Slovakia (sk), Slovenia (sl), Spanyol (es), Swahili (sw), Swedia (sv), Thailand (th), Turkiye (tr), Ukraina (uk), Vietnam (vi)
Model Gemini 2.0 Flash, Gemini 1.5 Pro, dan Gemini 1.5 Flash dapat memahami dan merespons dalam bahasa tambahan berikut:
Afrikaans (af), Amharik (am), Assam (as), Azerbaijan (az), Belarus (be), Bosnia (bs), Katalan (ca), Cebuano (ceb), Korsika (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persia (fa), Filipina (Tagalog) (fil), Frisia (fy), Irlandia (ga), Gaelik Skotlandia (gd), Galisia (gl), Gujarat (gu), Hausa (ha), Hawaii (haw), Hmong (hmn), Kreol Haiti (ht), Armenia (hy), Igbo (ig), Islandia (is), Jawa (jv), Georgia (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdi (ku), Kirgiz (ky), Latin (la), Luksemburg (lb), Laos (lo), Malagasy (mg), Maori (mi), Makedonia (mk), Malayalam (ml), Mongolia (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Melayu (ms), Malta (mt), Myanmar (Burma) (my), Nepal (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoa (sm), Shona (sn), Somalia (so), Albania (sq), Sesotho (st), Sunda (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)
Imagen
Ketersediaan umum: Inggris
Pratinjau: China (aksara sederhana), China (aksara tradisional), Hindi, Jepang, Korea, Portugis, Spanyol
Informasi tentang model lama
Firebase AI Logic mendukung model Gemini aktif lama (seperti model Gemini 1.5).
Firebase AI Logic tidak mendukung model Imagen lama (seperti Imagen 2).
Model | Input | Output | Dioptimalkan untuk |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
teks, kode, PDF, gambar, video, audio | teks, kode, JSON | Mendukung tugas penalaran kompleks yang memerlukan lebih banyak kecerdasan; Konteks panjang 2 juta |
Gemini 1.5 Flashgemini-1.5-flash-002 |
teks, kode, PDF, gambar, video, audio | teks, kode, JSON | Menawarkan performa yang cepat dan serbaguna di berbagai tugas |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
Langkah berikutnya
Mencoba kemampuan Gemini API
- Buat percakapan multi-giliran (chat).
- Buat teks dari perintah khusus teks.
- Buat teks dengan meminta berbagai jenis file, seperti gambar, PDF, video, dan audio.
- Buat output terstruktur (seperti JSON) dari prompt teks dan multimodal.
- Buat gambar dari perintah teks.
- Streaming input dan output (termasuk audio) menggunakan Gemini Live API.
- Gunakan panggilan fungsi untuk menghubungkan model generatif ke sistem dan informasi eksternal.