Gemini API की लागत, इस्तेमाल, और अन्य मेट्रिक पर नज़र रखना

प्रोडक्शन ऐप्लिकेशन चलाने के लिए, Gemini API की लागत, इस्तेमाल, और अन्य मेट्रिक को मॉनिटर करना ज़रूरी है. यह जानना ज़रूरी है कि आपके ऐप्लिकेशन के लिए, सामान्य इस्तेमाल के पैटर्न कैसे दिखते हैं. साथ ही, यह पक्का करें कि आपने अपने लिए तय की गई थ्रेशोल्ड को पार न किया हो.

लागतों पर नज़र रखना

Firebase कंसोल के इस्तेमाल और बिलिंग डैशबोर्ड में, Gemini API in Vertex AI को कॉल करने पर अपने प्रोजेक्ट की लागत देखी जा सकती है.

डैशबोर्ड पर दिखाई गई लागतें, Vertex AI in Firebase क्लाइंट एसडीके के ज़रिए किए गए कॉल के लिए ज़रूरी नहीं हैं. दिखाई गई कीमतें, Gemini API in Vertex AI के किसी भी कॉल से जुड़ी होती हैं. भले ही, वह Vertex AI in Firebase क्लाइंट SDK टूल, Vertex AI सर्वर SDK टूल, Genkit, Gemini API के लिए Firebase Extensions, REST कॉल, Vertex AI Studio या अन्य एपीआई क्लाइंट का इस्तेमाल कर रहा हो.

Count Tokens API का इस्तेमाल करके, अपने अनुरोधों के टोकन साइज़ और बिलिंग के लिए ज़रूरी वर्णों का अनुमान भी लगाया जा सकता है. हर मॉडल के लिए टोकन की सीमाओं और हर मॉडल के लिए कीमत के बारे में ज़्यादा जानें.

सूचनाएं पाने की सुविधा सेट अप करना

अचानक आने वाले बिल से बचने के लिए, पक्का करें कि आपने बजट की चेतावनियां सेट अप की हों.

ध्यान दें कि बजट खत्म होने की चेतावनियां, बजट के कैप नहीं हैं. कॉन्फ़िगर किए गए थ्रेशोल्ड के करीब पहुंचने या उससे ज़्यादा ट्रैफ़िक मिलने पर, आपको सूचना भेजी जाएगी. इससे, आपको अपने ऐप्लिकेशन या प्रोजेक्ट में कार्रवाई करने में मदद मिलेगी.

इस्तेमाल और अन्य मेट्रिक पर नज़र रखना

Google Cloud कंसोल में, हर एपीआई के लिए अपने प्रोजेक्ट की मेट्रिक देखी जा सकती हैं. जैसे, एपीआई के इस्तेमाल की जानकारी.

  1. Google Cloud कंसोल में, हर एपीआई पेज पर जाएं: Vertex AI एपीआई और Vertex AI in Firebase एपीआई.

    • Vertex AI एपीआई पेज: यह Gemini API in Vertex AI को किए गए किसी भी कॉल से जुड़ा इस्तेमाल है. भले ही, वह कॉल Vertex AI in Firebase क्लाइंट SDK टूल, Vertex AI सर्वर SDK टूल, Genkit, Gemini API के लिए Firebase Extensions, REST कॉल, Vertex AI Studio वगैरह का इस्तेमाल करता हो.

    • Vertex AI in Firebase एपीआई पेज: इसका इस्तेमाल, खास तौर पर Vertex AI in Firebase SDK टूल से आने वाले कॉल के लिए किया जाता है.

  2. प्रबंधित करें पर क्लिक करें.

  3. मेट्रिक टैब पर क्लिक करें.

  4. अपनी पसंद की मेट्रिक देखने के लिए, ड्रॉप-डाउन मेन्यू का इस्तेमाल करें. जैसे, रिस्पॉन्स कोड के हिसाब से ट्रैफ़िक, एपीआई के तरीके के हिसाब से गड़बड़ियां, कुल इंतज़ार का समय, और एपीआई के तरीके के हिसाब से इंतज़ार का समय.