Mempelajari model yang didukung

Untuk aplikasi seluler dan web, SDK Firebase AI Logic memungkinkan Anda berinteraksi dengan model Gemini dan model Imagen 3 yang didukung langsung dari aplikasi Anda.

Model Gemini dianggap multimodal karena mampu memproses dan bahkan menghasilkan beberapa modalitas, termasuk teks, kode, PDF, gambar, video, dan audio. Model Imagen 3 dapat diminta dengan teks untuk membuat gambar.

Tabel berikut adalah ringkasan singkat model yang didukung untuk Firebase AI Logic dan nama model stabil terbarunya. Tabel ini juga mencantumkan pratinjau dan model eksperimental yang tersedia untuk membuat prototipe kasus penggunaan.

Model Input Output Deskripsi
Model Gemini dengan versi stabil
Gemini 2.0 Flash
gemini-2.0-flash-001
teks, kode, PDF, gambar, video, audio teks, kode, JSON
(gambar & audio segera hadir!)
Model multimodal kami dengan fitur generasi berikutnya dan kemampuan yang ditingkatkan, termasuk kecepatan yang unggul, penggunaan alat bawaan, dan jendela konteks 1 juta token (pembuatan multimodal segera hadir!)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
teks, kode, PDF, gambar, video, audio teks, kode, JSON Model Flash tercepat dan paling hemat biaya kami. Ini adalah jalur upgrade untuk pengguna 1.5 Flash yang menginginkan kualitas yang lebih baik dengan harga dan kecepatan yang sama.
Model Gemini dengan pratinjau saja dan versi eksperimen (direkomendasikan hanya untuk kasus penggunaan pembuatan prototipe)
Gemini 2.5 Pro
gemini-2.5-pro-preview-05-06
teks, kode, PDF, gambar, video, audio teks, kode, JSON Model penalaran kami yang paling canggih, yang mampu menyelesaikan masalah kompleks.
Gemini 2.5 Flash
gemini-2.5-flash-preview-04-17
teks, kode, PDF, gambar, video, audio teks, kode, JSON Model pemikiran kami yang menawarkan kemampuan yang luar biasa dan menyeluruh. Layanan ini dirancang untuk menawarkan keseimbangan antara harga dan performa.
Gemini 2.0 Flash‑Live 1
gemini-2.0-flash-live-preview-04-09
teks (streaming),
audio (streaming)
teks (streaming),
audio (streaming)
Model multimodal kami yang mendukung streaming real-time berlatensi rendah untuk input dan output multimodal.
Model Imagen 3 (saat menggunakan dengan Firebase AI Logic)
Imagen 3
imagen-3.0-generate-002
teks gambar Menghasilkan gambar realistis dan berkualitas tinggi dari perintah teks bahasa alami
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
teks gambar Membuat gambar untuk pembuatan prototipe atau kasus penggunaan latensi rendah

1 Tidak didukung saat menggunakan Gemini Developer API dengan SDK Firebase AI Logic.
2 Tidak didukung oleh Gemini Developer API, apa pun cara Anda mengakses API.

Selain itu, tinjau FAQ kami tentang semua model yang didukung dan tidak didukung oleh Firebase AI Logic.


Bagian lain dari halaman ini memberikan informasi mendetail tentang model yang didukung oleh Firebase AI Logic.

Di bagian bawah halaman ini, Anda dapat melihat informasi mendetail tentang model lama.



Bandingkan model

Setiap model memiliki kemampuan yang berbeda untuk mendukung berbagai kasus penggunaan. Perhatikan bahwa setiap tabel di bagian ini menjelaskan setiap model saat digunakan dengan Firebase AI Logic. Setiap model mungkin memiliki kemampuan tambahan yang tidak tersedia saat menggunakan SDK kami.

Jika tidak dapat menemukan informasi yang Anda cari di subbagian berikut, Anda dapat menemukan informasi selengkapnya dalam dokumentasi penyedia API yang dipilih:

Input dan output yang didukung

Berikut adalah jenis input dan output yang didukung saat menggunakan setiap model dengan Firebase AI Logic:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Flash Gemini
2.5 </span="notranslate">
<span="notranslate">Flash Gemini
2.0 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Jenis input
Teks
Teks (streaming)
Kode
Dokumen
(PDF atau teks biasa)
Gambar
Video
Audio
Audio (streaming)
Jenis output
Teks
Teks (streaming)
Kode
Output terstruktur
(seperti JSON)
Gambar segera hadir!
Audio segera hadir!
Audio (streaming)

Untuk mempelajari jenis file yang didukung, lihat Persyaratan dan file input yang didukung.

Kemampuan dan fitur yang didukung

Berikut adalah kemampuan dan fitur yang didukung saat menggunakan setiap model dengan Firebase AI Logic:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Flash Gemini
2.5 </span="notranslate">
<span="notranslate">Flash Gemini
2.0 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Membuat teks dari input khusus teks atau multimodal streaming saja
Buat gambar
(Imagen 3)
segera hadir!
Membuat audio segera hadir! streaming saja
Buat output terstruktur
(seperti JSON)
Menganalisis dokumen
(PDF atau teks biasa)
Menganalisis gambar (visi)
Menganalisis video (visi)
Menganalisis audio streaming saja
Multi-turn chat
Panggilan fungsi (alat)
Token jumlah
Petunjuk sistem
Streaming multimodal dua arah

Spesifikasi dan batasan

Berikut adalah spesifikasi dan batasan saat menggunakan setiap model dengan Firebase AI Logic:

Properti <span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Flash Gemini
2.5 </span="notranslate">
<span="notranslate">Flash Gemini
2.0 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
Jendela konteks *
Total batas token
(input+output gabungan)
1.048.576 token 1.048.576 token 1.048.576 token 1.048.576 token 32.768 token 480 token
Batas token output * 65.536 token 65.536 token 8.192 token 8.192 token --- ---
Tanggal batas informasi Januari 2025 Januari 2025 Juni 2024 Juni 2024 Agustus 2024 ---
PDF (sesuai permintaan)
Jumlah maksimum
file PDF input **
3.000 file 3.000 file 3.000 file 3.000 file --- ---
Jumlah maksimum
halaman
per file PDF input **
1.000 halaman 1.000 halaman 1.000 halaman 1.000 halaman --- ---
Ukuran maks.
per file PDF input
50 MB 50 MB 50 MB 50 MB --- ---
Gambar (per permintaan)
Jumlah maksimum
gambar input
3.000 gambar 3.000 gambar 3.000 gambar 3.000 gambar --- ---
Jumlah maksimum
gambar output
--- --- segera hadir! --- --- 4 gambar
Ukuran maksimum
per gambar berenkode base64 input
7 MB 7 MB 7 MB 7 MB --- ---
Video (sesuai permintaan)
Jumlah maksimum
file video input
10 file 10 file 10 file 10 file --- ---
Panjang maksimum
semua video input
(hanya frame)
~60 menit ~60 menit ~60 menit ~60 menit --- ---
Panjang maksimum
semua video input
(frame+audio)
~45 menit ~45 menit ~45 menit ~45 menit --- ---
Audio (sesuai permintaan)
Jumlah maksimum
file audio input
1 file 1 file 1 file 1 file --- ---
Jumlah maksimum
file audio output
--- --- segera hadir! --- --- ---
Panjang maksimum
dari semua audio input
~8,4 jam ~8,4 jam ~8,4 jam ~8,4 jam --- ---
Panjang maksimum
dari semua audio output
--- --- segera hadir! --- --- ---

* Untuk semua model Gemini, token setara dengan sekitar 4 karakter, sehingga 100 token adalah sekitar 60-80 kata dalam bahasa Inggris. Untuk model Gemini, Anda dapat menentukan jumlah total token dalam permintaan menggunakan countTokens.

** PDF diperlakukan sebagai gambar, sehingga satu halaman PDF diperlakukan sebagai satu gambar. Jumlah halaman yang diizinkan dalam permintaan dibatasi pada jumlah gambar yang dapat didukung model.

Menemukan informasi mendetail tambahan



Pola penamaan dan pembuatan versi model

Model ditawarkan dalam versi stabil, pratinjau, dan eksperimental. Untuk kemudahan, alias tanpa nilai versi eksplisit didukung.

Untuk menemukan nama model tertentu yang akan digunakan dalam kode Anda, lihat bagian "nama model yang tersedia" nanti di halaman ini.

Jenis versi /
Tahap rilis
Deskripsi Pola nama model
Stabil Versi Stabil tersedia dan didukung untuk penggunaan produksi mulai tanggal rilis.

Versi model stabil biasanya dirilis dengan tanggal penghentian, yang menunjukkan hari terakhir model tersedia. Setelah tanggal ini, model tidak dapat lagi diakses atau didukung oleh Google.

Nama model versi stabil ditambahkan dengan nomor versi tiga digit tertentu

Contoh: gemini-2.0-flash-001
Contoh: imagen-3.0-generate-002

Alias stabil yang diupdate otomatis Alias stabil diupdate otomatis selalu mengarah ke versi stabil terbaru dari model tersebut. Jika versi stabil baru dirilis, alias diupdate otomatis akan otomatis mulai mengarah ke versi stabil baru tersebut.

Nama model alias tidak memiliki imbuhan

Contoh: gemini-2.0-flash

Pratinjau Versi Pratinjau memiliki kemampuan baru dan dianggap tidak stabil.

Versi pratinjau selalu mengarah ke versi pratinjau terbaru model tersebut. Jika versi pratinjau baru dirilis, versi pratinjau yang ada akan otomatis mulai mengarah ke versi pratinjau baru tersebut.

Model ini tidak direkomendasikan untuk penggunaan produksi, dilengkapi dengan batas kapasitas yang lebih ketat, dan mungkin memiliki persyaratan penagihan.

Nama model versi pratinjau ditambahkan dengan -preview beserta tanggal rilis model (-MM-DD)

Contoh: gemini-2.5-flash-preview-04-17
(dirilis pada 17 April 2025)

Eksperimental Versi Eksperimental memiliki kemampuan baru dan dianggap tidak stabil.

Model ini tidak direkomendasikan untuk penggunaan produksi dan memiliki batas kapasitas yang lebih ketat. Model eksperimental ditujukan untuk mengumpulkan masukan dan memungkinkan eksperimen dengan fitur terbaru kami.

Nama model versi eksperimental ditambahkan dengan -exp beserta tanggal rilis model (-MM-DD)

Contoh: gemini-2.5-pro-exp-03-25
(dirilis pada 25 Maret 2025)

Pensiunan Versi Tidak digunakan lagi telah melewati tanggal penghentiannya dan telah dinonaktifkan secara permanen.

Model yang tidak digunakan lagi tidak dapat diakses atau didukung oleh Google. Permintaan yang mereferensikan ID model yang tidak digunakan lagi biasanya menampilkan error 404.

---



Nama model yang tersedia

Nama model adalah nilai eksplisit yang Anda sertakan dalam kode selama inisialisasi model.

Mencantumkan semua model yang tersedia secara terprogram

Anda dapat mencantumkan semua nama model yang tersedia menggunakan REST API:

Perhatikan bahwa daftar yang ditampilkan ini akan menyertakan semua model yang didukung oleh penyedia API, tetapi Firebase AI Logic hanya mendukung model Gemini dan Imagen yang dijelaskan di halaman ini. Perhatikan juga bahwa alias yang diperbarui secara otomatis (misalnya, gemini-2.0-flash) tidak tercantum karena merupakan alias praktis untuk model dasar.

Gemini nama model

Untuk contoh inisialisasi untuk platform Anda, lihat panduan memulai.

Untuk mengetahui detail tentang tahap rilis (terutama untuk kasus penggunaan dan penagihan), lihat pola penamaan dan pembuatan versi model.

Gemini 2.5 Pro nama model

Nama model Deskripsi Tahap rilis Tanggal rilis Tanggal penghentian
gemini-2.5-pro-preview-05-06 Versi pratinjau Gemini 2.5 Pro Pratinjau 2025-05-06 Belum ditentukan
gemini-2.5-pro-preview-03-25 Versi pratinjau yang mengarah ke gemini-2.5-pro-preview-05-06
(yang merupakan versi pratinjau terbaru)
Pratinjau 25-03-2025 Belum ditentukan

Gemini 2.5 Flash nama model

Nama model Deskripsi Tahap rilis Tanggal rilis Tanggal penghentian
gemini-2.5-flash-preview-04-17 Versi pratinjau Gemini 2.5 Flash Pratinjau 2025-04-17 Belum ditentukan

Gemini 2.0 Flash nama model

Nama model Deskripsi Tahap rilis Tanggal rilis Tanggal penghentian
gemini-2.0-flash-001 Gemini 2.0 Flash versi stabil terbaru Stabil 2025-02-05 Tidak lebih awal dari
05-02-2026
gemini-2.0-flash Alias yang diperbarui secara otomatis yang mengarah ke versi stabil terbaru Flash 2.0
(saat ini gemini-2.0-flash-001)
Stabil 2025-02-10 ---

Gemini 2.0 Flash‑Lite nama model

Nama model Deskripsi Tahap rilis Tanggal rilis Tanggal penghentian
gemini-2.0-flash-lite-001 Gemini 2.0 Flash‑Lite versi stabil terbaru Stabil 2025-02-25 Tidak lebih awal dari
25-02-2026
gemini-2.0-flash-lite Alias yang diperbarui secara otomatis yang mengarah ke versi stabil terbaru 2.0 Flash-Lite
(saat ini gemini-2.0-flash-lite-001)
Stabil 2025-02-25 ---

Gemini 2.0 Flash‑Live nama model

Hanya tersedia saat menggunakan Vertex AI Gemini API sebagai penyedia API Anda.

Nama model Deskripsi Tahap rilis Tanggal rilis Tanggal penghentian
gemini-2.0-flash-live-preview-04-09 1 Versi pratinjau untuk Gemini 2.0 Flash‑Live Pratinjau 2025-04-09 Belum ditentukan

1 Tidak didukung saat menggunakan Gemini Developer API dengan SDK Firebase AI Logic.

Imagen nama model

Untuk contoh inisialisasi untuk platform Anda, lihat panduan membuat gambar dengan Imagen.

Untuk mengetahui detail tentang tahap rilis (terutama untuk kasus penggunaan dan penagihan), lihat pola penamaan dan pembuatan versi model.

Imagen 3 nama model

Nama model Deskripsi Tahap rilis Tanggal rilis Tanggal penghentian
imagen-3.0-generate-002 Imagen 3 versi stabil terbaru Stabil 2025-01-23 Tidak lebih awal dari 23-01-2026
imagen-3.0-generate-001 2 Versi stabil awal Imagen 3 Stabil 2024-07-31 Tidak lebih awal dari 31-07-2025

Imagen 3 Fast nama model

Nama model Deskripsi Tahap rilis Tanggal rilis Tanggal penghentian
imagen-3.0-fast-generate-001 2 Versi stabil awal Imagen 3 Fast Stabil 2024-07-31 Tidak lebih awal dari 31-07-2025

2 Tidak didukung oleh Gemini Developer API, apa pun cara Anda mengakses API.



Bahasa yang didukung

Gemini

  • Semua model Gemini dapat memahami dan merespons dalam bahasa berikut:

    Arab (ar), Bengali (bn), Bulgaria (bg), China sederhana dan tradisional (zh), Kroasia (hr), Ceko (cs), Denmark (da), Belanda (nl), Inggris (en), Estonia (et), Finlandia (fi), Prancis (fr), Jerman (de), Yunani (el), Ibrani (iw), Hindi (hi), Hungaria (hu), Indonesia (id), Italia (it), Jepang (ja), Korea (ko), Latvia (lv), Lituania (lt), Norwegia (no), Polandia (pl), Portugis (pt), Rumania (ro), Rusia (ru), Serbia (sr), Slovakia (sk), Slovenia (sl), Spanyol (es), Swahili (sw), Swedia (sv), Thailand (th), Turkiye (tr), Ukraina (uk), Vietnam (vi)

  • Model Gemini 2.0 Flash, Gemini 1.5 Pro, dan Gemini 1.5 Flash dapat memahami dan merespons dalam bahasa tambahan berikut:

    Afrikaans (af), Amharik (am), Assam (as), Azerbaijan (az), Belarus (be), Bosnia (bs), Katalan (ca), Cebuano (ceb), Korsika (co), Welsh (cy), Dhivehi (dv), Esperanto (eo), Basque (eu), Persia (fa), Filipina (Tagalog) (fil), Frisia (fy), Irlandia (ga), Gaelik Skotlandia (gd), Galisia (gl), Gujarat (gu), Hausa (ha), Hawaii (haw), Hmong (hmn), Kreol Haiti (ht), Armenia (hy), Igbo (ig), Islandia (is), Jawa (jv), Georgia (ka), Kazakh (kk), Khmer (km), Kannada (kn), Krio (kri), Kurdi (ku), Kirgiz (ky), Latin (la), Luksemburg (lb), Laos (lo), Malagasy (mg), Maori (mi), Makedonia (mk), Malayalam (ml), Mongolia (mn), Meiteilon (Manipuri) (mni-Mtei), Marathi (mr), Melayu (ms), Malta (mt), Myanmar (Burma) (my), Nepal (ne), Nyanja (Chichewa) (ny), Odia (Oriya) (or), Punjabi (pa), Pashto (ps), Sindhi (sd), Sinhala (Sinhalese) (si), Samoa (sm), Shona (sn), Somalia (so), Albania (sq), Sesotho (st), Sunda (su), Tamil (ta), Telugu (te), Tajik (tg), Uyghur (ug), Urdu (ur), Uzbek (uz), Xhosa (xh), Yiddish (yi), Yoruba (yo), Zulu (zu)

Imagen

  • Ketersediaan umum: Inggris

  • Pratinjau: China (aksara sederhana), China (aksara tradisional), Hindi, Jepang, Korea, Portugis, Spanyol



Informasi tentang model lama

Firebase AI Logic mendukung model Gemini aktif lama (seperti model Gemini 1.5).

Firebase AI Logic tidak mendukung model Imagen lama (seperti Imagen 2).

Model Input Output Dioptimalkan untuk
Gemini 1.5 Pro
gemini-1.5-pro-002
teks, kode, PDF, gambar, video, audio teks, kode, JSON Mendukung tugas penalaran kompleks yang memerlukan lebih banyak kecerdasan; Konteks panjang 2 juta
Gemini 1.5 Flash
gemini-1.5-flash-002
teks, kode, PDF, gambar, video, audio teks, kode, JSON Menawarkan performa yang cepat dan serbaguna di berbagai tugas
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
teks, kode, PDF, gambar, video (hanya frame) text, code Menangani teks, gambar, dan video untuk respons teks atau kode. Tidak dapat digunakan untuk chat.
Gemini 1.0 Pro
gemini-1.0-pro-002
text, code text, code Tugas natural language, teks multi-giliran dan chat kode, serta pembuatan kode



Langkah berikutnya

Mencoba kemampuan Gemini API