מעקב אחרי העלויות, השימוש ומדדים אחרים של Gemini API הוא חלק חשוב מהפעלת אפליקציה בסביבת ייצור. חשוב לדעת איך נראים דפוסי השימוש הרגילים באפליקציה שלכם ולוודא שאתם לא חורגים מהסף שחשוב לכם.
מעקב אחרי העלויות
בלוח הבקרה Usage and Billing במסוף Firebase אפשר לראות את העלויות של הקריאות ל-Gemini API in Vertex AI בפרויקט.
העלויות שמוצגות במרכז הבקרה לא בהכרח ספציפיות לשיחות דרך ערכות ה-SDK של הלקוח של Vertex AI in Firebase. העלויות המוצגות משויכות לכל קריאה ל-Gemini API in Vertex AI, בין שבאמצעות ערכות ה-SDK של הלקוח Vertex AI in Firebase, בין שבאמצעות ערכות ה-SDK של השרת Vertex AI, בין שבאמצעות Genkit, בין שבאמצעות Firebase Extensions ל-Gemini API, בין שבאמצעות קריאות REST, בין שבאמצעות Vertex AI Studio ובין שבאמצעות לקוחות API אחרים.
אפשר גם לקבל אומדן של גודל האסימון והתווים לחיוב של הבקשות באמצעות Count Tokens API. מידע נוסף על מגבלות האסימונים לכל מודל ותמחור לכל מודל
הגדרת התראות
כדי להימנע מחיובים לא צפויים, חשוב להגדיר התראות לגבי תקציבים.
חשוב לזכור שהתראות לגבי תקציב הן לא תקרות לתקציב. תקבלו התראות כשאתם מתקרבים לסף שהגדרתם או חורגים ממנו, כדי שתוכלו לבצע פעולות באפליקציה או בפרויקט.
מעקב אחר שימוש ומדדים אחרים
אפשר לראות את המדדים של הפרויקט לכל ממשק API, כמו השימוש בו, במסוף Google Cloud.
במסוף Google Cloud, עוברים לכל דף API: Vertex AI API ו-Vertex AI in Firebase API.
דף ה-API של Vertex AI: זהו השימוש שמשויך לכל קריאה ל-Gemini API in Vertex AI, בין שבאמצעות ערכות ה-SDK של הלקוח Vertex AI in Firebase, בין שבאמצעות ערכות ה-SDK של השרת Vertex AI, בין שבאמצעות Genkit, בין שבאמצעות Firebase Extensions ל-Gemini API, בין שבאמצעות קריאות ל-REST, בין שבאמצעות Vertex AI Studio וכו'.
דף ה-API של Vertex AI in Firebase: זהו השימוש הספציפי בקריאות שמגיעות מ-SDK של Vertex AI in Firebase.
לוחצים על ניהול.
לוחצים על הכרטיסייה Metrics.
בתפריטים הנפתחים אפשר לראות את המדדים הרלוונטיים, כמו תנועה לפי קוד תגובה, שגיאות לפי שיטת API, זמן אחזור כולל וזמן אחזור לפי שיטת API.