Firebase AI Logic का इस्तेमाल करके Gemini API

Firebase AI Logic का इस्तेमाल करके, Gemini और Imagen मॉडल की मदद से, एआई की मदद से काम करने वाले मोबाइल और वेब ऐप्लिकेशन और सुविधाएं बनाना

Firebase AI Logic में आपको Google के जनरेटिव एआई के नए मॉडल का ऐक्सेस मिलता है: Gemini मॉडल और Imagen मॉडल.

अगर आपको सर्वर-साइड के बजाय, सीधे तौर पर अपने मोबाइल या वेब ऐप्लिकेशन से Gemini API या Imagen API को कॉल करना है, तो Firebase AI Logic क्लाइंट एसडीके का इस्तेमाल किया जा सकता है. ये क्लाइंट एसडीके, खास तौर पर मोबाइल और वेब ऐप्लिकेशन के साथ इस्तेमाल करने के लिए बनाए गए हैं. ये अनधिकृत क्लाइंट के ख़िलाफ़ सुरक्षा के विकल्प के साथ-साथ, Firebase की अन्य सेवाओं के साथ इंटिग्रेशन की सुविधा भी देते हैं.

ये क्लाइंट एसडीके, Apple प्लैटफ़ॉर्म के लिए Swift, Android के लिए Kotlin और Java, वेब के लिए JavaScript, Flutter के लिए Dart, और Unity में उपलब्ध हैं.

इन क्लाइंट SDK की मदद से, ऐप्लिकेशन में एआई की मदद से लोगों की दिलचस्पी के हिसाब से कॉन्टेंट दिखाया जा सकता है. साथ ही, एआई चैट की सुविधा बनाई जा सकती है. इसके अलावा, एआई की मदद से ऑप्टिमाइज़ेशन और ऑटोमेशन किया जा सकता है. साथ ही, कई अन्य काम किए जा सकते हैं!

शुरू करें


क्या आपको ज़्यादा विकल्प चाहिए या सर्वर-साइड इंटिग्रेशन की ज़रूरत है?
Genkit, Firebase का ओपन-सोर्स फ़्रेमवर्क है. इसका इस्तेमाल, सर्वर-साइड एआई को बेहतर तरीके से डेवलप करने के लिए किया जाता है. इसमें Google, OpenAI, Anthropic वगैरह के मॉडल का ऐक्सेस होता है. इसमें एआई की ज़्यादा बेहतर सुविधाएं और स्थानीय टूल शामिल हैं.

मुख्य सुविधाएं

मल्टीमोडल और नैचुरल लैंग्वेज इनपुट Gemini मॉडल मल्टीमॉडल हैं. इसलिए, Gemini API को भेजे गए प्रॉम्प्ट में टेक्स्ट, इमेज, PDF, वीडियो, और ऑडियो शामिल हो सकते हैं. कुछ Gemini मॉडल, कई तरह के फ़ॉर्मैट में आउटपुट जनरेट कर सकते हैं.

Gemini और Imagen, दोनों मॉडल को नैचुरल लैंग्वेज इनपुट के साथ प्रॉम्प्ट किया जा सकता है.

सुविधाओं का बढ़ता दायरा एसडीके की मदद से, अपने मोबाइल या वेब ऐप्लिकेशन से सीधे तौर पर Gemini API या Imagen API को कॉल किया जा सकता है. इससे ये काम किए जा सकते हैं: एआई चैट की सुविधाएं बनाना, इमेज जनरेट करना, टूल इस्तेमाल करना. जैसे, फ़ंक्शन कॉलिंग और Google Search से जानकारी पाना, मल्टीमॉडल इनपुट और आउटपुट (इसमें ऑडियो भी शामिल है) स्ट्रीम करना, और अन्य काम.
प्रोडक्शन ऐप्लिकेशन के लिए सुरक्षा और बुरे बर्ताव को रोकना Firebase App Check का इस्तेमाल करके, Gemini और Imagen मॉडल को ऐक्सेस करने वाले एपीआई को, अनुमति के बिना इस्तेमाल करने वाले क्लाइंट से सुरक्षित रखें.

Firebase AI Logic में डिफ़ॉल्ट रूप से हर उपयोगकर्ता के लिए दर की सीमाएं भी होती हैं. साथ ही, हर उपयोगकर्ता के लिए दर की इन सीमाओं को पूरी तरह से कॉन्फ़िगर किया जा सकता है.

मज़बूत इन्फ़्रास्ट्रक्चर मोबाइल और वेब ऐप्लिकेशन के साथ इस्तेमाल करने के लिए बनाए गए स्केलेबल इन्फ़्रास्ट्रक्चर का फ़ायदा पाएं. जैसे, Cloud Storage for Firebase की मदद से फ़ाइलें मैनेज करना, Firebase डेटाबेस की सुविधाओं (जैसे कि Cloud Firestore) की मदद से स्ट्रक्चर्ड डेटा मैनेज करना, और Firebase Remote Config की मदद से, रन-टाइम कॉन्फ़िगरेशन को डाइनैमिक तरीके से सेट करना.

यह कैसे काम करता है?

Firebase AI Logic क्लाइंट SDK टूल, प्रॉक्सी सेवा, और अन्य सुविधाएँ उपलब्ध कराता है. इनकी मदद से, Google के जनरेटिव एआई मॉडल को ऐक्सेस किया जा सकता है. इससे अपने मोबाइल और वेब ऐप्लिकेशन में एआई सुविधाएँ बनाई जा सकती हैं.

Google के मॉडल और "Gemini API" की सेवा देने वाली कंपनियों के साथ काम करता है

हम Gemini और Imagen 3 के सभी नए मॉडल के साथ काम करते हैं. इन मॉडल को ऐक्सेस करने के लिए, आपको अपनी पसंद का "Gemini API" प्रोवाइडर चुनना होता है. हम Gemini Developer API और Vertex AI Gemini API, दोनों का इस्तेमाल करने का विकल्प देते हैं. एपीआई की सुविधा देने वाली इन दोनों कंपनियों के बीच के अंतर के बारे में जानें.

अगर आपको Gemini Developer API का इस्तेमाल करना है, तो "मुफ़्त टियर" का फ़ायदा लें. इससे आपको जल्दी शुरुआत करने में मदद मिलेगी.

मोबाइल और वेब क्लाइंट SDK टूल

हमारे Firebase AI Logic क्लाइंट एसडीके का इस्तेमाल करके, अपने मोबाइल या वेब ऐप्लिकेशन से सीधे तौर पर मॉडल को अनुरोध भेजे जा सकते हैं. ये एसडीके, Apple प्लैटफ़ॉर्म के लिए Swift, Android के लिए Kotlin और Java, वेब के लिए JavaScript, Flutter के लिए Dart, और Unity में उपलब्ध हैं.

अगर आपने अपने Firebase प्रोजेक्ट में दोनों Gemini API प्रोवाइडर सेट अप किए हैं, तो एपीआई प्रोवाइडर के बीच स्विच किया जा सकता है. इसके लिए, आपको सिर्फ़ दूसरे एपीआई को चालू करना होगा और शुरू करने वाले कोड की कुछ लाइनें बदलनी होंगी.

इसके अलावा, वेब के लिए उपलब्ध हमारा क्लाइंट SDK, डेस्कटॉप पर Chrome में चल रहे वेब ऐप्लिकेशन के लिए हाइब्रिड और डिवाइस पर इन्फ़रेंस की एक्सपेरिमेंटल ऐक्सेस सुविधा देता है. इस कॉन्फ़िगरेशन की मदद से, आपका ऐप्लिकेशन उपलब्ध होने पर डिवाइस पर मौजूद मॉडल का इस्तेमाल कर सकता है. हालांकि, ज़रूरत पड़ने पर यह क्लाउड पर होस्ट किए गए मॉडल पर आसानी से स्विच कर सकता है.

प्रॉक्सी सेवा

हमारी प्रॉक्सी सेवा, क्लाइंट और आपके चुने हुए Gemini API सेवा देने वाले (और Google के मॉडल) के बीच एक गेटवे के तौर पर काम करती है. यह मोबाइल और वेब ऐप्लिकेशन के लिए ज़रूरी सेवाएं और इंटिग्रेशन उपलब्ध कराता है. उदाहरण के लिए, Firebase App Check सेट अप किया जा सकता है. इससे, एपीआई उपलब्ध कराने वाली कंपनी और बैकएंड रिसॉर्स को, बिना अनुमति वाले क्लाइंट के गलत इस्तेमाल से बचाया जा सकता है.

अगर आपने Gemini Developer API का इस्तेमाल करने का विकल्प चुना है, तो यह खास तौर पर ज़रूरी है. ऐसा इसलिए, क्योंकि हमारी प्रॉक्सी सेवा और App Check इंटिग्रेशन यह पक्का करते हैं कि आपकी Gemini एपीआई कुंजी सर्वर पर बनी रहे और आपके ऐप्लिकेशन के कोडबेस में एम्बेड हो.

लागू करने का तरीका

अपना Firebase प्रोजेक्ट सेट अप करना और अपने ऐप्लिकेशन को Firebase से कनेक्ट करना Firebase कंसोल के Firebase AI Logic पेज पर दिए गए निर्देशों का पालन करके, अपना प्रोजेक्ट सेट अप करें. इसमें, चुने गए Gemini API प्रोवाइडर के लिए ज़रूरी एपीआई चालू करना, अपने ऐप्लिकेशन को Firebase प्रोजेक्ट के साथ रजिस्टर करना, और फिर अपने ऐप्लिकेशन में Firebase कॉन्फ़िगरेशन जोड़ना शामिल है.
एसडीके इंस्टॉल करना और उसे शुरू करना अपने ऐप्लिकेशन के प्लैटफ़ॉर्म के हिसाब से Firebase AI Logic SDK इंस्टॉल करें. इसके बाद, सेवा को शुरू करें और अपने ऐप्लिकेशन में मॉडल इंस्टेंस बनाएं.
Gemini और Imagen मॉडल को प्रॉम्प्ट के अनुरोध भेजना एसडीके का इस्तेमाल करके, Gemini मॉडल को सिर्फ़ टेक्स्ट या मल्टीमॉडल प्रॉम्प्ट भेजे जा सकते हैं. इससे टेक्स्ट और कोड, स्ट्रक्चर्ड आउटपुट (जैसे कि JSON), और इमेज जनरेट की जा सकती हैं. इसके अलावा, Imagen मॉडल को इमेज जनरेट करने के लिए भी प्रॉम्प्ट दिया जा सकता है.

कई बार बातचीत करने की सुविधा, टेक्स्ट और ऑडियो की दोनों ओर से स्ट्रीमिंग, और फ़ंक्शन कॉलिंग की मदद से, बेहतर अनुभव पाएं.

प्रोडक्शन के लिए तैयारी करना मोबाइल और वेब ऐप्लिकेशन के लिए ज़रूरी इंटिग्रेशन लागू करें. जैसे, Firebase App Check का इस्तेमाल करके, एपीआई को गलत इस्तेमाल से बचाना और Firebase Remote Config का इस्तेमाल करके, अपने कोड में पैरामीटर को दूर से अपडेट करना (जैसे, मॉडल का नाम).

अगले चरण

अपने मोबाइल या वेब ऐप्लिकेशन से किसी मॉडल को ऐक्सेस करना शुरू करना

'शुरू करना' गाइड पर जाएं

साथ काम करने वाले मॉडल के बारे में ज़्यादा जानें

अलग-अलग कामों के लिए उपलब्ध मॉडल और उनके कोटे और कीमत के बारे में जानें.