मोबाइल और वेब ऐप्लिकेशन के लिए, Firebase AI Logic SDK टूल की मदद से, सीधे अपने ऐप्लिकेशन से, काम करने वाले Gemini मॉडल और Imagen 3 मॉडल के साथ इंटरैक्ट किया जा सकता है.
Gemini मॉडल को मल्टीमोडल माना जाता है, क्योंकि ये टेक्स्ट, कोड, PDF, इमेज, वीडियो, और ऑडियो जैसे कई तरह के इनपुट को प्रोसेस करने के साथ-साथ जनरेट भी कर सकते हैं. Imagen 3 मॉडल को टेक्स्ट के ज़रिए इमेज जनरेट करने के लिए कहा जा सकता है.
यहां दी गई टेबल में, Firebase AI Logic के साथ काम करने वाले मॉडल और उनके सबसे नए मॉडल के नामों की खास जानकारी दी गई है. इस टेबल में, प्रोटोटाइप के इस्तेमाल के उदाहरणों के लिए उपलब्ध, झलक और प्रयोग के तौर पर उपलब्ध मॉडल की सूची भी दी गई है.
मॉडल | इनपुट | आउटपुट | ब्यौरा |
---|---|---|---|
Gemini स्टेबल वर्शन वाले मॉडल | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON (इमेज और ऑडियो की सुविधा जल्द ही उपलब्ध होगी!) |
अगली पीढ़ी की सुविधाओं और बेहतर क्षमताओं वाला हमारा मल्टी-मोडल मॉडल. इसमें बेहतर स्पीड, बिल्ट-इन टूल का इस्तेमाल, और 10 लाख टोकन वाली कॉन्टेक्स्ट विंडो शामिल है. मल्टी-मोडल जनरेशन जल्द ही उपलब्ध होगा! |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | यह हमारा सबसे तेज़ और किफ़ायती फ़्लैश मॉडल है. यह 1.5 Flash का इस्तेमाल करने वाले उन लोगों के लिए अपग्रेड पाथ है जो पहले जैसी कीमत और स्पीड पर बेहतर क्वालिटी चाहते हैं. |
Gemini ऐसे मॉडल जिनके सिर्फ़ झलक और एक्सपेरिमेंटल वर्शन उपलब्ध हैं (सिर्फ़ प्रोटोटाइप बनाने के उदाहरणों के लिए सुझाया गया) | |||
Gemini 2.5 Progemini-2.5-pro-preview-05-06
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | हमारा सबसे ऐडवांस रीज़निंग मॉडल, जो मुश्किल समस्याओं को हल कर सकता है. |
Gemini 2.5 Flashgemini-2.5-flash-preview-04-17
|
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | हमारा थिंकिंग मॉडल, बेहतरीन और बेहतर सुविधाएं देता है. इसे कीमत और परफ़ॉर्मेंस के बीच संतुलन बनाने के लिए डिज़ाइन किया गया है. |
Gemini 2.0 Flash‑Live 1gemini-2.0-flash-live-preview-04-09
|
टेक्स्ट (स्ट्रीमिंग), ऑडियो (स्ट्रीमिंग) |
टेक्स्ट (स्ट्रीमिंग), ऑडियो (स्ट्रीमिंग) |
हमारा मल्टीमोडल मॉडल, मल्टीमोडल इनपुट और आउटपुट की कम इंतज़ार वाली रीयल-टाइम स्ट्रीमिंग की सुविधा देता है. |
Imagen 3 मॉडल (Firebase AI Logic के साथ इस्तेमाल करने पर) | |||
Imagen 3imagen-3.0-generate-002 |
टेक्स्ट | इमेज | सामान्य भाषा के टेक्स्ट के प्रॉम्प्ट से, असली जैसी और अच्छी क्वालिटी की इमेज जनरेट करता है |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
टेक्स्ट | इमेज | प्रोटोटाइप बनाने या कम इंतज़ार वाले इस्तेमाल के उदाहरणों के लिए इमेज जनरेट करता है |
1 Firebase AI Logic एसडीके टूल के साथ Gemini Developer API का इस्तेमाल करने पर, यह सुविधा काम नहीं करती.
2 Gemini Developer API के साथ काम नहीं करता, भले ही एपीआई को ऐक्सेस करने का तरीका कुछ भी हो.
साथ ही, उन सभी मॉडल के बारे में अक्सर पूछे जाने वाले सवाल देखें जिन पर Firebase AI Logic काम करता है और जिन पर नहीं करता.
इस पेज पर, Firebase AI Logic के साथ काम करने वाले मॉडल के बारे में ज़्यादा जानकारी दी गई है.
-
- इस्तेमाल किए जा सकने वाले इनपुट और आउटपुट
- काम करने वाली सुविधाओं की खास जानकारी
- खास जानकारी और सीमाएं. उदाहरण के लिए, इनपुट टोकन की ज़्यादा से ज़्यादा संख्या या इनपुट वीडियो की ज़्यादा से ज़्यादा अवधि
मॉडल के वर्शन बनाने का तरीका, खास तौर पर उनके स्टैबल, अपने-आप अपडेट होने वाले, झलक, और प्रयोग के तौर पर उपलब्ध वर्शन
उपलब्ध मॉडल के नाम की सूचियां, जिन्हें शुरू करने के दौरान अपने कोड में शामिल करना है
मॉडल के लिए इस्तेमाल की जा सकने वाली भाषाओं की सूचियां
इस पेज पर सबसे नीचे, पुराने मॉडल के बारे में ज़्यादा जानकारी देखी जा सकती है.
मॉडल की तुलना करें
हर मॉडल में अलग-अलग सुविधाएं होती हैं, ताकि अलग-अलग तरह के कामों में इसका इस्तेमाल किया जा सके. ध्यान दें कि Firebase AI Logic के साथ इस्तेमाल करने पर, इस सेक्शन की हर टेबल में हर मॉडल के बारे में जानकारी दी जाती है. हर मॉडल में ऐसी अतिरिक्त सुविधाएं हो सकती हैं जो हमारे SDK टूल का इस्तेमाल करते समय उपलब्ध नहीं होती हैं.
अगर आपको यहां दिए गए सब-सेक्शन में अपनी पसंद की जानकारी नहीं मिलती है, तो एपीआई की सेवा देने वाली कंपनी के दस्तावेज़ में ज़्यादा जानकारी देखी जा सकती है:
Gemini Developer API: Gemini मॉडल और Imagen मॉडल
Vertex AI Gemini API: Gemini मॉडल और Imagen मॉडल
इस्तेमाल किए जा सकने वाले इनपुट और आउटपुट
Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, इनपुट और आउटपुट के ये टाइप इस्तेमाल किए जा सकते हैं:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|||
---|---|---|---|---|---|---|---|---|
इनपुट टाइप | ||||||||
टेक्स्ट | ||||||||
टेक्स्ट (स्ट्रीमिंग) | ||||||||
कोड | ||||||||
दस्तावेज़ (PDF या सादा टेक्स्ट) |
||||||||
इमेज | ||||||||
वीडियो | ||||||||
ऑडियो | ||||||||
ऑडियो (स्ट्रीमिंग) | ||||||||
आउटपुट टाइप | ||||||||
टेक्स्ट | ||||||||
टेक्स्ट (स्ट्रीमिंग) | ||||||||
कोड | ||||||||
स्ट्रक्चर्ड आउटपुट (जैसे, JSON) |
||||||||
इमेज | जल्द ही उपलब्ध होगा! | |||||||
ऑडियो | जल्द ही उपलब्ध होगा! | |||||||
ऑडियो (स्ट्रीमिंग) |
इस्तेमाल किए जा सकने वाले फ़ाइल टाइप के बारे में जानने के लिए, इस्तेमाल की जा सकने वाली इनपुट फ़ाइलें और ज़रूरी शर्तें देखें.
इस्तेमाल की जा सकने वाली सुविधाएं और क्षमताएं
Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, ये सुविधाएं और काम करने की क्षमताएं उपलब्ध होती हैं:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|
सिर्फ़ टेक्स्ट या अलग-अलग तरह के इनपुट से टेक्स्ट जनरेट करना | सिर्फ़ स्ट्रीमिंग | |||||
इमेज जनरेट करें (Imagen 3) |
जल्द ही उपलब्ध होगा! | |||||
ऑडियो जनरेट करना | जल्द ही उपलब्ध होगा! | सिर्फ़ स्ट्रीमिंग | ||||
स्ट्रक्चर्ड आउटपुट जनरेट करें
(जैसे, JSON) |
||||||
दस्तावेज़ों का विश्लेषण करना
(PDF या सादा टेक्स्ट) |
||||||
इमेज का विश्लेषण करना (विज़न) | ||||||
वीडियो का विश्लेषण करना (विज़न) | ||||||
ऑडियो का विश्लेषण करना | सिर्फ़ स्ट्रीमिंग | |||||
मल्टी-टर्न चैट | ||||||
फ़ंक्शन कॉलिंग (टूल) | ||||||
टोकन की गिनती करना | ||||||
सिस्टम से जुड़े निर्देश | ||||||
दोनों तरफ़ की मल्टीमोडल स्ट्रीमिंग |
खास जानकारी और सीमाएं
Firebase AI Logic के साथ हर मॉडल का इस्तेमाल करते समय, ये खास बातें और सीमाएं लागू होती हैं:
प्रॉपर्टी |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|---|
कॉन्टेक्स्ट विंडो * टोकन की कुल सीमा (इनपुट+आउटपुट को मिलाकर) |
1,048,576 टोकन | 1,048,576 टोकन | 1,048,576 टोकन | 1,048,576 टोकन | 32,768 टोकन | 480 टोकन | |
आउटपुट टोकन की सीमा * | 65,536 टोकन | 65,536 टोकन | 8,192 टोकन | 8,192 टोकन | --- | --- | |
नॉलेज कट्सऑफ़ की तारीख | जनवरी 2025 | जनवरी 2025 | जून 2024 | जून 2024 | अगस्त 2024 | --- | |
PDF (हर अनुरोध के हिसाब से) | |||||||
इनपुट PDF फ़ाइलों की ज़्यादा से ज़्यादा संख्या ** |
3,000 फ़ाइलें | 3,000 फ़ाइलें | 3,000 फ़ाइलें | 3,000 फ़ाइलें | --- | --- | |
हर इनपुट PDF फ़ाइल में पेजों की ज़्यादा से ज़्यादा संख्या ** |
1,000 पेज | 1,000 पेज | 1,000 पेज | 1,000 पेज | --- | --- | |
हर इनपुट PDF फ़ाइल का ज़्यादा से ज़्यादा साइज़ |
50 एमबी | 50 एमबी | 50 एमबी | 50 एमबी | --- | --- | |
इमेज (हर अनुरोध के लिए) | |||||||
इनपुट इमेज की ज़्यादा से ज़्यादा संख्या |
3,000 इमेज | 3,000 इमेज | 3,000 इमेज | 3,000 इमेज | --- | --- | |
आउटपुट इमेज की ज़्यादा से ज़्यादा संख्या |
--- | --- | जल्द ही उपलब्ध होगा! | --- | --- | चार इमेज | |
हर इनपुट के लिए, Base64 कोड में बदली गई इमेज का ज़्यादा से ज़्यादा साइज़ |
7 एमबी | 7 एमबी | 7 एमबी | 7 एमबी | --- | --- | |
वीडियो (हर अनुरोध के हिसाब से) | |||||||
इनपुट वीडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या |
10 फ़ाइलें | 10 फ़ाइलें | 10 फ़ाइलें | 10 फ़ाइलें | --- | --- | |
सभी इनपुट वीडियो की ज़्यादा से ज़्यादा लंबाई(सिर्फ़ फ़्रेम) |
~60 मिनट | ~60 मिनट | ~60 मिनट | ~60 मिनट | --- | --- | |
सभी इनपुट वीडियो (फ़्रेम+ऑडियो) की ज़्यादा से ज़्यादा लंबाई |
~45 मिनट | ~45 मिनट | ~45 मिनट | ~45 मिनट | --- | --- | |
ऑडियो (हर अनुरोध के हिसाब से) | |||||||
इनपुट ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या |
1 फ़ाइल | 1 फ़ाइल | 1 फ़ाइल | 1 फ़ाइल | --- | --- | |
आउटपुट के तौर पर जनरेट की जाने वाली ऑडियो फ़ाइलों की ज़्यादा से ज़्यादा संख्या |
--- | --- | जल्द ही उपलब्ध होगा! | --- | --- | --- | |
इनपुट ऑडियो की ज़्यादा से ज़्यादा लंबाई |
~8.4 घंटे | ~8.4 घंटे | ~8.4 घंटे | ~8.4 घंटे | --- | --- | |
आउटपुट ऑडियो की ज़्यादा से ज़्यादा लंबाई |
--- | --- | जल्द ही उपलब्ध होगा! | --- | --- | --- |
*
सभी Gemini मॉडल के लिए, एक टोकन करीब चार वर्णों के बराबर होता है. इसलिए, 100 टोकन करीब 60 से 80 अंग्रेज़ी शब्दों के बराबर होते हैं. Gemini मॉडल के लिए, countTokens
का इस्तेमाल करके, अपने अनुरोधों में टोकन की कुल संख्या तय की जा सकती है.
** PDF को इमेज के तौर पर माना जाता है. इसलिए, PDF के एक पेज को एक इमेज के तौर पर माना जाता है. किसी अनुरोध में पेजों की संख्या, उन इमेज की संख्या तक सीमित होती है जिनके लिए मॉडल काम करता है.
ज़्यादा जानकारी पाना
हर मॉडल के लिए कोटा और कीमत अलग-अलग होती है. कीमत, इनपुट और आउटपुट पर भी निर्भर करती है.
इनपुट फ़ाइल के इस्तेमाल किए जा सकने वाले टाइप, एमआईएम टाइप तय करने के तरीके, और इनपुट फ़ाइल के इस्तेमाल किए जा सकने वाले टाइप और ज़रूरी शर्तों में बताए गए सबसे सही तरीकों का पालन करने के बारे में जानें.
मॉडल के वर्शन और नाम देने के पैटर्न
मॉडल, स्टैबल, झलक, और प्रयोग के तौर पर उपलब्ध होते हैं. सुविधा के लिए, वर्शन की वैल्यू के बिना उपनाम इस्तेमाल किए जा सकते हैं.
अपने कोड में इस्तेमाल करने के लिए, मॉडल के खास नाम ढूंढने के लिए, इस पेज पर नीचे दिए गए "मॉडल के उपलब्ध नाम" सेक्शन को देखें.
वर्शन टाइप / रिलीज़ का स्टेज |
ब्यौरा | मॉडल के नाम का पैटर्न | |
---|---|---|---|
स्थिर |
रिलीज़ की तारीख से, स्टैबल वर्शन उपलब्ध होते हैं और इन्हें प्रोडक्शन में इस्तेमाल किया जा सकता है.
आम तौर पर, मॉडल के स्टेबल वर्शन को रिलीज़ करने के साथ ही, उसे बंद करने की तारीख भी तय की जाती है. इससे यह पता चलता है कि मॉडल का इस्तेमाल आखिरी बार कब किया जा सकता है. इस तारीख के बाद, मॉडल को ऐक्सेस नहीं किया जा सकेगा या Google पर इसका इस्तेमाल नहीं किया जा सकेगा. |
स्टेबल वर्शन के मॉडल के नाम के साथ, वर्शन का तीन वर्णों वाला खास नंबर जोड़ा जाता है
उदाहरण: |
|
अपने-आप अपडेट होने वाला स्टेबल आलियास | अपने-आप अपडेट होने वाले स्टेबल आइडेंटिफ़ायर हमेशा उस मॉडल के सबसे नए स्टेबल वर्शन पर ले जाते हैं. अगर कोई नया स्टेबल वर्शन रिलीज़ किया जाता है, तो अपने-आप अपडेट होने वाला दूसरा नाम, अपने-आप उस नए स्टेबल वर्शन पर ले जाता है. |
अन्य नाम वाले मॉडल के नाम में कोई ऐपेंडिज नहीं है
उदाहरण: |
|
झलक देखें |
झलक वाले वर्शन में नई सुविधाएं होती हैं और इन्हें स्टेबल नहीं माना जाता.
झलक वाले वर्शन, हमेशा उस मॉडल के नए झलक वर्शन पर ले जाते हैं. अगर झलक का कोई नया वर्शन रिलीज़ किया जाता है, तो झलक का कोई भी मौजूदा वर्शन, अपने-आप उस नए वर्शन पर ले जाता है. इन मॉडल का सुझाव, प्रोडक्शन में इस्तेमाल के लिए नहीं दिया जाता. इनमें, बिलिंग की ज़रूरी शर्तें हो सकती हैं और दरों की सीमाएं ज़्यादा पाबंदी वाली होती हैं. |
प्रीव्यू वर्शन के मॉडल के नाम के साथ,
उदाहरण: |
|
एक्सपेरिमेंटल |
प्रयोग के तौर पर उपलब्ध वर्शन में नई सुविधाएं होती हैं और इन्हें स्टेबल नहीं माना जाता.
इन मॉडल का इस्तेमाल प्रोडक्शन के लिए नहीं किया जाता. साथ ही, इनमें किराये की सीमाएं ज़्यादा होती हैं. एक्सपेरिमेंट के तौर पर उपलब्ध मॉडल का मकसद, सुझाव, शिकायत या राय पाना और हमारी नई सुविधाओं को आज़माना है. |
एक्सपेरिमेंट के तौर पर उपलब्ध वर्शन के मॉडल के नाम के साथ,
उदाहरण: |
|
रिटायर्ड |
बंद किए गए वर्शन, बंद किए जाने की तारीख से पहले ही बंद कर दिए गए हैं और उन्हें हमेशा के लिए बंद कर दिया गया है.
बंद किए गए मॉडल को अब ऐक्सेस नहीं किया जा सकता. साथ ही, Google इन मॉडल के साथ काम नहीं करता. बंद किए गए मॉडल आईडी का रेफ़रंस देने वाले अनुरोधों पर, आम तौर पर 404 कोड वाली गड़बड़ी का मैसेज दिखता है. |
--- |
मॉडल के उपलब्ध नाम
मॉडल के नाम, साफ़ तौर पर बताई गई वैल्यू होती हैं. इन्हें मॉडल को शुरू करने के दौरान, अपने कोड में शामिल किया जाता है.
प्रोग्राम के ज़रिए सभी उपलब्ध मॉडल की सूची बनाना
REST API का इस्तेमाल करके, उपलब्ध सभी मॉडल के नामों की सूची देखी जा सकती है:
Gemini Developer API:
models.list
एंडपॉइंट को कॉल करेंVertex AI Gemini API:
publishers.models.list
एंडपॉइंट को कॉल करें
ध्यान दें कि इस सूची में, एपीआई की सेवा देने वाली कंपनियों के साथ काम करने वाले सभी मॉडल शामिल होंगे. हालांकि, Firebase AI Logic सिर्फ़ इस पेज पर बताए गए Gemini और Imagen मॉडल के साथ काम करता है.
यह भी ध्यान दें कि अपने-आप अपडेट होने वाले उपनाम (उदाहरण के लिए, gemini-2.0-flash
) सूची में शामिल नहीं किए जाते, क्योंकि ये बुनियादी मॉडल के लिए सुविधाजनक उपनाम होते हैं.
Gemini मॉडल के नाम
अपने प्लैटफ़ॉर्म के लिए, शुरू करने के उदाहरणों के लिए, शुरू करने के लिए गाइड देखें.
रिलीज़ के चरणों के बारे में ज़्यादा जानने के लिए, मॉडल के वर्शन और नाम देने के पैटर्न देखें.
Gemini 2.5 Pro मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
gemini-2.5-pro-preview-05-06 |
Gemini 2.5 Pro का झलक वाला वर्शन | झलक देखें | 2025-05-06 | निर्धारण शेष |
gemini-2.5-pro-preview-03-25 |
gemini-2.5-pro-preview-05-06 (जो झलक का नया वर्शन है) |
झलक देखें | 2025-03-25 | निर्धारण शेष |
Gemini 2.5 Flash मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
gemini-2.5-flash-preview-04-17 |
Gemini 2.5 Flash का झलक वाला वर्शन | झलक देखें | 2025-04-17 | निर्धारण शेष |
Gemini 2.0 Flash मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
gemini-2.0-flash-001 |
Gemini 2.0 Flash का सबसे नया स्टेबल वर्शन | स्टेबल | 2025-02-05 | 2026-02-05 से पहले नहीं |
gemini-2.0-flash |
अपने-आप अपडेट होने वाला दूसरा नाम, जो Flash 2.0 के सबसे नए स्टेबल वर्शन (फ़िलहाल gemini-2.0-flash-001 |
स्टेबल | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Gemini 2.0 Flash‑Lite का सबसे नया स्टेबल वर्शन | स्टेबल | 2025-02-25 | 2026-02-25 से पहले नहीं |
gemini-2.0-flash-lite |
2.0 Flash-Lite के नए स्टेबल वर्शन पर अपने-आप अपडेट होने वाला आलियास (फ़िलहाल gemini-2.0-flash-lite-001 |
स्टेबल | 2025-02-25 | --- |
Gemini 2.0 Flash‑Live मॉडल के नाम
यह सिर्फ़ तब उपलब्ध होता है, जब एपीआई प्रोवाइडर के तौर पर Vertex AI Gemini API का इस्तेमाल किया जा रहा हो. |
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Gemini 2.0 Flash‑Live के लिए प्रीव्यू वर्शन | झलक देखें | 2025-04-09 | निर्धारण शेष |
1 Firebase AI Logic एसडीके टूल के साथ Gemini Developer API का इस्तेमाल करने पर, यह सुविधा काम नहीं करती.
Imagen मॉडल के नाम
अपने प्लैटफ़ॉर्म के लिए, शुरू करने के उदाहरणों के लिए, Imagen गाइड की मदद से इमेज जनरेट करना देखें.
रिलीज़ के चरणों के बारे में ज़्यादा जानने के लिए, मॉडल के वर्शन और नाम देने के पैटर्न देखें.
Imagen 3 मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
imagen-3.0-generate-002 |
Imagen 3 का सबसे नया स्टेबल वर्शन | स्टेबल | 2025-01-23 | 23-01-2026 से पहले नहीं |
imagen-3.0-generate-001 2 |
Imagen 3 का शुरुआती स्टेबल वर्शन | स्टेबल | 2024-07-31 | 31-07-2025 से पहले नहीं |
Imagen 3 Fast मॉडल के नाम
मॉडल का नाम | ब्यौरा | रिलीज़ का स्टेज | रिलीज़ की तारीख | रिटायरमेंट की तारीख |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Imagen 3 Fast का शुरुआती स्टेबल वर्शन | स्टेबल | 2024-07-31 | 31-07-2025 से पहले नहीं |
2 Gemini Developer API में यह सुविधा काम नहीं करती. भले ही, आपने एपीआई को ऐक्सेस करने का कोई भी तरीका अपनाया हो.
यह सुविधा इन भाषाओं में काम करती है
Gemini
सभी Gemini मॉडल, इन भाषाओं को समझ सकते हैं और इनमें जवाब दे सकते हैं:
ऐरेबिक (ar), बांग्ला (bn), बुल्गारियन (bg), चाइनीज़ सिम्प्लिफ़ाइड और ट्रेडिशनल (zh), क्रोएशियन (hr), चेक (cs), डेनिश (da), डच (nl), अंग्रेज़ी (en), एस्टोनियन (et), फ़िनिश (fi), फ़्रेंच (fr), जर्मन (de), ग्रीक (el), हिब्रू (iw), हिन्दी (hi), हंगेरियन (hu), इंडोनेशियन (id), इटैलियन (it), जैपनीज़ (ja), कोरियन (ko), लातवियन (lv), लिथुआनियन (lt), नॉर्वेजियन (no), पोलिश (pl), पॉर्चगीज़ (pt), रोमेनियन (ro), रशियन (ru), सर्बियन (sr), स्लोवाक (sk), स्लोवेनियन (sl), स्पैनिश (es), स्वाहिली (sw), स्वीडिश (sv), थाई (th), टर्किश (tr), यूक्रेनियन (uk), वियतनामीज़ (vi)
Gemini 2.0 Flash, Gemini 1.5 Pro, और Gemini 1.5 Flash मॉडल, इन अन्य भाषाओं को समझ सकते हैं और इनमें जवाब दे सकते हैं:
अफ़्रीकान्स (af), अम्हारिक (am), असमिया (as), अज़ेरी (az), बेलारूसी (be), बोस्नियाई (bs), कैटलन (ca), सिबुआनो (ceb), कोर्सिकन (co), वेल्श (cy), दीवेही (dv), एस्पेरांटो (eo), बास्क (eu), फ़ारसी (fa), फ़िलिपिनो (Tagalog) (fil), फ़्रिसियन (fy), आयरिश (ga), स्कॉटिश गेलिक (gd), गैलिशियन (gl), गुजराती (gu), हौसा (ha), हवाईयन (haw), हमोंग (hmn), हैतीयन क्रेओल (ht), अर्मेनियाई (hy), इग्बो (ig), आइसलैंडिक (is), ज्वानेस (jv), जॉर्जियन (ka), कज़ाख (kk), खमेर (km), कन्नड़ (kn), क्रियो (kri), कुर्दीश (ku), किर्गिज़ (ky), लैटिन (la), लक्ज़मबर्गिश (lb), लाओ (lo), मलागासी (mg), माओरी (mi), मैसेडोनियन (mk), मलयालम (ml), मंगोलियन (mn), मेइतेइलोन (मणिपुरी) (mni-Mtei), मराठी (mr), मलय (ms), माल्टीज़ (mt), म्यांमार (बर्मीज़) (my), नेपाली (ne), न्यान्या (चिचेवा) (ny), ओडिया (ओडिया) (or), पंजाबी (pa), पश्तो (ps), सिंधी (sd), सिंघल (सिंघल) (si), समोआन (sm), शोना (sn), सोमाली (so), अल्बानियाई (sq), सेसोथो (st), सुंडानी (su), तमिल (ta), तेलुगु (te), ताजिक (tg), उइघुर (ug), उर्दू (ur), उज़्बेक (uz), ज़ोसा (xh), येहुदी (yi), योरुबा (yo), ज़ुलु (zu)
Imagen
सामान्य तौर पर उपलब्धता: अंग्रेज़ी
झलक: चाइनीज़ (सिंप्लिफ़ाइड), चाइनीज़ (ट्रेडिशनल), हिन्दी, जैपनीज़, कोरियन, पॉर्चगीज़, स्पेनिश
पुराने मॉडल के बारे में जानकारी
Firebase AI Logic, Gemini के पुराने और चालू मॉडल (जैसे, Gemini 1.5 मॉडल) के साथ काम करता है.
Firebase AI Logic, Imagen के पुराने मॉडल (जैसे, Imagen 2) के साथ काम नहीं करता.
मॉडल | इनपुट | आउटपुट | इनके लिए ऑप्टिमाइज़ किया गया |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | ज़्यादा जानकारी की ज़रूरत वाले जटिल कामों के लिए काम करता है; 20 लाख वर्णों का कॉन्टेक्स्ट |
Gemini 1.5 Flashgemini-1.5-flash-002 |
टेक्स्ट, कोड, PDF, इमेज, वीडियो, ऑडियो | टेक्स्ट, कोड, JSON | अलग-अलग तरह के टास्क के लिए तेज़ और बेहतर परफ़ॉर्मेंस देता है |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
अगले चरण
Gemini API की सुविधाओं को आज़माएं
- कई बार बातचीत करने की सुविधा (चैट) बनाएं.
- सिर्फ़ टेक्स्ट वाले प्रॉम्प्ट से टेक्स्ट जनरेट करें.
- इमेज, PDF, वीडियो, और ऑडियो जैसी अलग-अलग फ़ाइल टाइप के लिए प्रॉम्प्ट करके टेक्स्ट जनरेट करें.
- टेक्स्ट और मल्टीमोडल प्रॉम्प्ट, दोनों से स्ट्रक्चर्ड आउटपुट (जैसे, JSON) जनरेट करें.
- टेक्स्ट प्रॉम्प्ट से इमेज जनरेट करें.
- Gemini Live API का इस्तेमाल करके, इनपुट और आउटपुट को स्ट्रीम करें. इसमें ऑडियो भी शामिल है.
- जनरेटिव मॉडल को बाहरी सिस्टम और जानकारी से कनेक्ट करने के लिए, फ़ंक्शन कॉल का इस्तेमाल करें.