ขีดจำกัดอัตราและโควต้า

คลิกผู้ให้บริการ Gemini API เพื่อดูเนื้อหาและโค้ดเฉพาะผู้ให้บริการในหน้านี้


ขีดจำกัดอัตรา (หรือที่เรียกว่าโควต้า) จะควบคุมจำนวนคำขอที่คุณส่งไปยัง Gemini API ได้ภายในกรอบเวลาหนึ่งๆ ขีดจํากัดเหล่านี้ช่วยรับรองการใช้งานที่ยุติธรรม ป้องกันการละเมิด และช่วยรักษาประสิทธิภาพของระบบสําหรับผู้ใช้ทุกคน

เมื่อใช้ Firebase AI Logic เพื่อส่งคำขอไปยังโมเดล Gemini และ Imagen ขีดจำกัดอัตราของโปรเจ็กต์จะขึ้นอยู่กับผู้ให้บริการ "Gemini API" ที่คุณเลือก Firebase AI Logic ยังมีวิธีกำหนดขีดจำกัดอัตรา "ต่อผู้ใช้" ด้วย

ดูขีดจำกัดราคาสำหรับ Gemini Developer API

วิธีการทำงานของขีดจำกัดอัตรา (โควต้า)

การจำกัดอัตรา (โควต้า) จะวัดในมิติข้อมูล 4 รายการต่อไปนี้

  • คำขอต่อนาที (RPM)
  • คำขอต่อวัน (RPD)
  • โทเค็นต่อนาที (TPM)
  • โทเค็นต่อวัน (TPD)

ระบบจะประเมินการใช้งานของคุณเทียบกับขีดจำกัดแต่ละรายการ และการใช้งานที่เกินขีดจำกัดใดขีดจำกัดหนึ่งจะทริกเกอร์ข้อผิดพลาด 429 โควต้าเกิน ตัวอย่างเช่น หากขีดจํากัด RPM คือ 20 การขอ 21 ครั้งภายใน 1 นาทีจะทำให้เกิดข้อผิดพลาด แม้ว่าคุณจะไม่ได้เกิน TPM หรือขีดจํากัดอื่นๆ ก็ตาม

ขีดจํากัดอัตราจะอยู่ที่ระดับโปรเจ็กต์และมีผลกับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

ขีดจํากัดจะแตกต่างกันไปตามรุ่นที่ใช้ และขีดจํากัดบางรายการจะมีผลกับบางรุ่นเท่านั้น เช่น รูปภาพต่อนาที (IPM) จะคำนวณสำหรับโมเดลที่สร้างรูปภาพได้เท่านั้น (Imagen 3) แต่มีความคล้ายคลึงกับ TPM ในแง่แนวคิด

อัตราสูงสุดจะจํากัดมากขึ้นสําหรับโมเดลทดลองและโมเดลเวอร์ชันตัวอย่าง

ขอเพิ่มขีดจำกัดอัตรา

หากใช้ Gemini Developer API ใน "ระดับแบบชำระเงิน" คุณจะขอเพิ่มขีดจำกัดอัตราได้

กำหนดขีดจำกัดอัตรา "ต่อผู้ใช้"

หากต้องการใช้ Firebase AI Logic โปรเจ็กต์ของคุณจะต้องเปิดใช้ผู้ให้บริการ Gemini API ที่เลือกไว้ แต่คุณจะต้องเปิดใช้ Firebase AI Logic API ด้วย ซึ่งทำหน้าที่เป็นเกตเวย์ระหว่าง SDK ของไคลเอ็นต์กับผู้ให้บริการ Gemini API ระบบจะเปิดใช้ API นี้ให้คุณเมื่อคุณตั้งค่า Firebase AI Logic ในโปรเจ็กต์ Firebase เป็นครั้งแรก

คุณใช้ขีดจำกัดอัตรา (โควต้า) ของ Firebase AI Logic API เป็นขีดจำกัดอัตรา "ต่อผู้ใช้" สำหรับแอปได้ โดยเฉพาะสำหรับฟีเจอร์ AI ที่ใช้ Firebase AI Logic คุณควรกำหนดขีดจำกัดนี้ให้เหมาะสมเพื่อรองรับผู้ใช้รายเดียวที่เข้าถึงฟีเจอร์ AI ของคุณ ในขณะเดียวกันก็ตรวจสอบว่าผู้ใช้รายเดียวไม่ได้ใช้ทรัพยากรของผู้ให้บริการ Gemini API มากเกินไป (ซึ่งผู้ใช้ทุกคนควรแชร์ร่วมกัน)

รายละเอียดเกี่ยวกับขีดจำกัดอัตรา "ต่อผู้ใช้"

รายละเอียดสําคัญบางอย่างเกี่ยวกับขีดจํากัดอัตรา (โควต้า) ของ Firebase AI Logic API มีดังนี้ โดยเฉพาะอย่างยิ่งคําขอต่อนาที (RPM)

  • ซึ่งอิงตาม "สร้างคำขอเนื้อหา" ในระดับต่อผู้ใช้ต่อภูมิภาคต่อนาที และไม่ได้อิงตามรูปแบบ

  • โดยจะมีผลในระดับโปรเจ็กต์และมีผลกับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

  • โดยจะมีผลกับการเรียกใช้ที่มาจาก Firebase AI LogicSDK ใดก็ตามโดยเฉพาะ

  • ขีดจำกัดอัตราเริ่มต้นคือ 100 RPM ต่อผู้ใช้
    โปรดทราบว่าคุณยังคงต้องคำนึงถึงขีดจำกัดของผู้ให้บริการ Gemini API (ดูด้านบน) ซึ่งมีความสำคัญเหนือกว่า Firebase AI Logic API

ปรับขีดจํากัดอัตรา "ต่อผู้ใช้"

หากต้องการปรับขีดจํากัดอัตรา (โควต้า) คุณต้องมีserviceusage.quotas.update สิทธิ์ ซึ่งรวมอยู่ในบทบาทเจ้าของและผู้แก้ไขโดยค่าเริ่มต้น

วิธีแก้ไขขีดจำกัดอัตรา (โควต้า) หรือขอเพิ่มมีดังนี้

  1. ในคอนโซล Google Cloud ให้ไปที่หน้าสำหรับ Firebase AI Logic API

  2. คลิกจัดการ

  3. คลิกแท็บโควต้าและขีดจํากัดของระบบที่ด้านล่างของหน้า

  4. กรองตารางเพื่อแสดงโควต้าความสนใจ เช่น ความสามารถ (คำขอสร้างเนื้อหา) และภูมิภาค

    ตัวอย่างเช่น หากต้องการดูโควต้าต่อผู้ใช้ในการสร้างคำขอเนื้อหาในภูมิภาคเอเชียที่รองรับ ตัวกรองจะมีลักษณะดังนี้ Generate content requests + Dimension:region:asia

  5. เลือกช่องทําเครื่องหมายทางด้านซ้ายของโควต้าความสนใจแต่ละรายการ

  6. ที่ท้ายแถวของโควต้า ให้คลิก แล้วเลือกแก้ไขโควต้า

  7. ในแบบฟอร์มการเปลี่ยนแปลงโควต้า ให้ทําดังนี้

    1. ป้อนโควต้าที่เพิ่มขึ้นในช่องค่าใหม่

      โดยโควต้านี้จะมีผลในระดับโปรเจ็กต์และแชร์กับแอปพลิเคชันและที่อยู่ IP ทั้งหมดที่ใช้โปรเจ็กต์ Firebase นั้น

    2. กรอกข้อมูลในช่องเพิ่มเติมในแบบฟอร์ม แล้วคลิกเสร็จสิ้น

    3. คลิกส่งคำขอ