ขีดจำกัดอัตราและโควต้า

คลิกผู้ให้บริการ Gemini API เพื่อดูเนื้อหาและโค้ดของผู้ให้บริการนั้นๆ ในหน้านี้


การจำกัดอัตรา (โดยทั่วไปเรียกว่าโควต้า) จะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ภายในกรอบเวลาที่กำหนด ขีดจำกัดเหล่านี้ช่วยให้มั่นใจได้ถึง การใช้งานที่เป็นธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสำหรับผู้ใช้ทุกคน

เมื่อใช้ Firebase AI Logic เพื่อส่งคำขอไปยังโมเดล Gemini และ Imagen ขีดจำกัดอัตราของโปรเจ็กต์จะขึ้นอยู่กับผู้ให้บริการ "Gemini API" ที่คุณเลือก Firebase AI Logic ยังมีวิธีตั้งค่าขีดจำกัดอัตรา "ต่อผู้ใช้" ด้วย

ดูขีดจำกัดอัตราการใช้งานสำหรับ Gemini Developer API

วิธีการทำงานของขีดจำกัดอัตรา (โควต้า)

ระบบจะวัดอัตราการจำกัด (โควต้า) ใน 4 มิติข้อมูลต่อไปนี้

  • คำขอต่อนาที (RPM)
  • คำขอต่อวัน (RPD)
  • โทเค็นต่อนาที (TPM)
  • โทเค็นต่อวัน (TPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานที่เกินขีดจำกัดใดก็ตามจะ ทําให้เกิดข้อผิดพลาด 429 ที่ระบุว่าโควต้าเกิน เช่น หากขีดจำกัด RPM คือ 20 การส่งคำขอ 21 รายการภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะยังไม่เกินขีดจำกัด TPM หรือขีดจำกัดอื่นๆ ก็ตาม

ระบบจะใช้ขีดจํากัดอัตราที่ระดับโปรเจ็กต์ และจะมีผลกับแอปพลิเคชันและ ที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

ขีดจำกัดจะแตกต่างกันไปขึ้นอยู่กับโมเดลที่ใช้ และขีดจำกัดบางอย่างจะใช้ได้กับโมเดลที่เฉพาะเจาะจงเท่านั้น เช่น ระบบจะคำนวณรูปภาพต่อนาที (IPM) สำหรับโมเดลที่สร้างรูปภาพได้ (Imagen 3) เท่านั้น แต่ในเชิงแนวคิดแล้วจะคล้ายกับ TPM

โมเดลทดลองและโมเดลเวอร์ชันตัวอย่างจะมีขีดจำกัดอัตราที่เข้มงวดกว่า

ขอเพิ่มขีดจำกัดอัตรา

หากใช้ Gemini Developer API ใน "ระดับแบบชำระเงิน" คุณจะขอเพิ่มขีดจำกัดอัตราได้

ตั้งค่าขีดจำกัดของอัตรา "ต่อผู้ใช้"

หากต้องการใช้ Firebase AI Logic โปรเจ็กต์ของคุณต้องเปิดใช้ผู้ให้บริการ Gemini API ที่คุณเลือก แต่คุณต้องเปิดใช้ Firebase AI Logic API ด้วย ซึ่งทำหน้าที่เป็นเกตเวย์ระหว่าง SDK ของไคลเอ็นต์กับผู้ให้บริการ Gemini API ระบบจะเปิดใช้ API นี้ให้คุณเมื่อตั้งค่า Firebase AI Logic ในโปรเจ็กต์ Firebase เป็นครั้งแรก

คุณสามารถใช้Firebase AI Logicขีดจำกัดอัตรา API (โควต้า) เป็นขีดจำกัดอัตรา "ต่อผู้ใช้" สำหรับแอป โดยเฉพาะสำหรับฟีเจอร์ AI ที่ต้องใช้ Firebase AI Logic คุณควรกำหนดขีดจำกัดนี้ให้เหมาะสม เพื่อรองรับผู้ใช้รายเดียวที่เข้าถึงฟีเจอร์ AI ของคุณ ขณะเดียวกันก็ต้องมั่นใจว่า ไม่มีผู้ใช้รายใดรายหนึ่งใช้เกินขีดจำกัดของผู้ให้บริการ Gemini API (ซึ่งมีไว้สำหรับผู้ใช้ทั้งหมดของคุณ)

รายละเอียดเกี่ยวกับขีดจำกัดของอัตรา "ต่อผู้ใช้"

รายละเอียดสำคัญเกี่ยวกับขีดจำกัดอัตราการใช้งาน (โควต้า) ของ Firebase AI Logic API โดยเฉพาะคำขอต่อนาที (RPM) มีดังนี้

  • โดยจะอิงตาม "คำขอสร้างเนื้อหา" ต่อผู้ใช้ 1 คนต่อภูมิภาค 1 แห่งต่อนาที และไม่ได้อิงตามโมเดล

  • โดยจะมีผลในระดับโปรเจ็กต์และมีผลกับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

  • โดยจะใช้กับการเรียกใช้ที่มาจาก Firebase AI Logic SDK โดยเฉพาะ

  • ขีดจำกัดของอัตราเริ่มต้นคือ 100 RPM ต่อผู้ใช้
    โปรดทราบว่าคุณยังคงต้องพิจารณา ขีดจำกัดสำหรับผู้ให้บริการ Gemini API (ดูด้านบน) ซึ่งมีความสำคัญเหนือกว่า Firebase AI Logic API

ปรับขีดจำกัดอัตรา "ต่อผู้ใช้"

หากต้องการปรับโควต้า คุณต้องมีserviceusage.quotas.update สิทธิ์ ซึ่งรวมอยู่ในบทบาทเจ้าของและผู้แก้ไขโดยค่าเริ่มต้น

วิธีแก้ไขขีดจํากัดอัตรา (โควต้า) หรือขอเพิ่มมีดังนี้

  1. ในGoogle Cloudคอนโซล ให้ไปที่หน้าสำหรับ Firebase AI Logic API

  2. คลิกจัดการ

  3. คลิกแท็บโควต้าและขีดจํากัดของระบบที่ด้านล่างของหน้า

  4. กรองตารางเพื่อแสดงโควต้าที่สนใจ เช่น ความสามารถ (คำขอในการสร้างเนื้อหา) และภูมิภาค

    ตัวอย่างเช่น หากต้องการดูโควต้าต่อผู้ใช้สำหรับการสร้างคำขอเนื้อหา ในภูมิภาคเอเชียที่รองรับ คุณจะต้องใช้ตัวกรองที่มีลักษณะคล้ายกับ ตัวกรองนี้ Generate content requests + Dimension:region:asia

  5. เลือกช่องทำเครื่องหมายทางด้านซ้ายของโควต้าแต่ละรายการที่สนใจ

  6. ที่ท้ายแถวของโควต้า ให้คลิก แล้วเลือกแก้ไขโควต้า

  7. ในแบบฟอร์มการเปลี่ยนแปลงโควต้า ให้ทำดังนี้

    1. ป้อนโควต้าที่เพิ่มขึ้นในช่องค่าใหม่

      โควต้านี้มีผลในระดับโปรเจ็กต์และใช้ร่วมกันใน แอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

    2. กรอกช่องเพิ่มเติมในแบบฟอร์ม แล้วคลิกเสร็จสิ้น

    3. คลิกส่งคำขอ