מכסות ומגבלות קצב

לוחצים על ספק Gemini API כדי להציג בדף הזה תוכן וקוד ספציפיים לספק.


מגבלות קצב (שנקראות בדרך כלל מכסות) קובעות את מספר הבקשות שאפשר לשלוח ל-Gemini API בפרק זמן נתון. המגבלות האלה עוזרות להבטיח שימוש הוגן, להגן מפני ניצול לרעה ולשמור על ביצועי המערכת לכל המשתמשים.

כשמשתמשים ב-Firebase AI Logic כדי לשלוח בקשות למודלים Gemini ו-Imagen, מגבלות הקצב של הפרויקט תלויות בספק Gemini API שבחרתם. Firebase AI Logic גם מאפשר להגדיר מגבלות קצב 'לכל משתמש'.

הצגת מגבלות הקצב של Gemini Developer API

איך פועלות מגבלות הקצב (מכסות)

המגבלות על קצב שליחת הבקשות (מכסות) נמדדות לפי ארבעה מאפיינים:

  • בקשות לדקה (RPM)
  • בקשות ליום (RPD)
  • טוקנים לדקה (TPM)
  • טוקנים ליום (TPD)

השימוש שלכם נבדק כנגד כל מגבלה, וכל שימוש מעבר למגבלה כלשהי יגרום לשגיאה 429 של חריגה מהמכסה. לדוגמה, אם המגבלה של בקשות לשעה היא 20, שליחת 21 בקשות בדקה תגרום לשגיאה, גם אם לא חרגתם מהמגבלה של בקשות לשעה או ממגבלות אחרות.

מגבלות הקצב חלות ברמת הפרויקט וחלות על כל האפליקציות ועל כל כתובות ה-IP שמשתמשות באותו פרויקט Firebase.

המגבלות משתנות בהתאם לדגם הספציפי שבו נעשה שימוש, וחלק מהמגבלות חלות רק על דגמים ספציפיים. לדוגמה, מספר התמונות לדקה (IPM) מחושב רק למודלים שיכולים ליצור תמונות (Imagen 3), אבל הוא דומה מבחינה מושגית ל-TPM.

המגבלות על קצב שליחת הבקשות מחמירות יותר במודלים ניסיוניים ובמודלים בתצוגה מקדימה.

בקשה להגדלת מגבלת הקצב

אם אתם משתמשים ב-Gemini Developer API ברמת תשלום, תוכלו לבקש הגדלה של מגבלת הקצב.

הגדרת מגבלות קצב 'לכל משתמש'

כדי להשתמש ב-Firebase AI Logic, צריך להפעיל בפרויקט את ספק ה-Gemini API שבחרתם, אבל צריך גם להפעיל את Firebase AI Logic API, שמשמשת כמעבר בין ערכות ה-SDK ללקוח שלנו לבין ספק ה-Gemini API. ה-API הזה מופעל כשמגדירים את Firebase AI Logic בפעם הראשונה בפרויקט ב-Firebase.

אתם יכולים להשתמש במכסה (הגבלת הקצב) של ה-API Firebase AI Logic כמגבלת קצב 'לכל משתמש' באפליקציה, במיוחד לפיצ'רים של ה-AI שמסתמכים על Firebase AI Logic. הגדרת המגבלה הזו צריכה להתאים למשתמש יחיד שרוצה לגשת לתכונות ה-AI שלכם, תוך הבטחה שאף משתמש לא יעלה על המגבלות של ספק Gemini API (שמיועד לשיתוף עם כל המשתמשים שלכם).

פרטים על הגבלת הקצב 'לכל משתמש'

ריכזנו כאן כמה פרטים חשובים לגבי המגבלות (המכסות) של קצב הבקשות ל-API Firebase AI Logic, ובמיוחד לגבי מספר הבקשות לדקה (RPM):

  • היא מבוססת על 'יצירת בקשות ליצירת תוכן' לכל משתמש, לכל אזור ולכל דקה, והיא לא מבוססת על מודל.

  • היא חלה ברמת הפרויקט וחלה על כל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט Firebase הזה.

  • הוא חל על כל קריאה שמגיעה באופן ספציפי מ-SDK של Firebase AI Logic.

  • הגבלת הקצב שמוגדרת כברירת מחדל היא 100 בקשות לשעה לכל משתמש.
    לתשומת ליבכם: עדיין צריך להביא בחשבון את המגבלות של ספק ה-Gemini API (ראו למעלה), שמקבלות עדיפות על פני ה-API של Firebase AI Logic.

שינוי של הגבלת הקצב 'לכל משתמש'

כדי לשנות את מגבלת הקצב (מכסה), צריכה להיות לכם ההרשאה serviceusage.quotas.update, שכלולה כברירת מחדל בתפקידים 'בעלים' ו'עריכה'.

כך עורכים את מגבלת הקצב (מכסה) או מבקשים להגדיל אותה:

  1. במסוף Google Cloud, עוברים לדף של Firebase AI Logic API.

  2. לוחצים על ניהול.

  3. בהמשך הדף, לוחצים על הכרטיסייה Quotas & System Limits.

  4. מסננים את הטבלה כדי להציג את המכסות הרלוונטיות, כמו היכולת (בקשות ליצירת תוכן) והאזור.

    לדוגמה, כדי להציג את המכסות לכל משתמש ליצירת בקשות ליצירת תוכן באזורים הנתמכים באסיה, המסנן ייראה כך: Generate content requests + Dimension:region:asia

  5. מסמנים את התיבה שמשמאל לכל מכסה שרוצים להציג.

  6. בסוף השורה של המכסה, לוחצים על ובוחרים באפשרות Edit quota.

  7. בטופס Quota changes, מבצעים את הפעולות הבאות:

    1. מזינים את המכסה המוגדלת בשדה New value.

      המכסה הזו חלה ברמת הפרויקט ומופעלת בכל האפליקציות וכתובות ה-IP שמשתמשות בפרויקט Firebase הזה.

    2. ממלאים את שאר השדות בטופס ולוחצים על Done.

    3. לוחצים על שליחת בקשה.