비율 제한 및 할당량

Gemini API 제공업체를 클릭하여 이 페이지에서 제공업체별 콘텐츠와 코드를 확인합니다.


비율 한도 (일반적으로 할당량이라고 함)는 지정된 기간 내에 Gemini API에 보낼 수 있는 요청 수를 규제합니다. 이러한 제한은 공정한 사용을 보장하고 악용을 방지하며 모든 사용자의 시스템 성능을 유지하는 데 도움이 됩니다.

Firebase AI Logic를 사용하여 GeminiImagen 모델에 요청을 전송하는 경우 프로젝트의 비율 제한은 선택한 'Gemini API' 제공업체에 따라 다릅니다. Firebase AI Logic'사용자당' 비율 한도를 설정하는 방법도 제공합니다.

Gemini Developer API의 비율 한도 보기

비율 제한 (할당량) 작동 방식

비율 제한 (할당량)은 다음 4가지 측정기준에 따라 측정됩니다.

  • 분당 요청 수 (RPM)
  • 일일 요청 수 (RPD)
  • 분당 토큰 수 (TPM)
  • 토큰/일 (TPD)

사용량은 각 한도에 대해 평가되며 한도를 초과하면 429 할당량 초과 오류가 발생합니다. 예를 들어 RPM 한도가 20인 경우 1분 이내에 21개 요청을 하면 TPM 또는 기타 한도를 초과하지 않았더라도 오류가 발생합니다.

비율 제한은 프로젝트 수준에서 적용되며 해당 Firebase 프로젝트를 사용하는 모든 애플리케이션과 IP 주소에 적용됩니다.

제한은 사용 중인 특정 모델에 따라 다르며 일부 제한은 특정 모델에만 적용됩니다. 예를 들어 이미지당 분당 개수 (IPM)는 이미지를 생성할 수 있는 모델 (Imagen 3)에 대해서만 계산되지만 개념적으로는 TPM과 유사합니다.

실험 및 미리보기 모델의 비율 제한은 더 엄격합니다.

요청 비율 한도 상향

Gemini Developer API의 '유료 등급'을 사용하는 경우 속도 제한 증가를 요청할 수 있습니다.

'사용자당' 비율 제한 설정

Firebase AI Logic를 사용하려면 프로젝트에서 선택한 Gemini API 제공업체를 사용 설정해야 하지만 Google 클라이언트 SDK와 Gemini API 제공업체 간의 게이트웨이 역할을 하는 Firebase AI Logic API도 사용 설정해야 합니다. 이 API는 Firebase 프로젝트에서 Firebase AI Logic를 처음 설정할 때 사용 설정됩니다.

Firebase AI Logic API 비율 제한 (할당량)을 앱의 '사용자당' 비율 제한으로 사용할 수 있습니다. 특히 Firebase AI Logic를 사용하는 AI 기능에 사용할 수 있습니다. AI 기능에 액세스하는 단일 사용자를 적절하게 수용하도록 이 한도를 설정하는 동시에 모든 사용자가 공유해야 하는 Gemini API 제공업체의 한도를 초과하는 단일 사용자가 없도록 해야 합니다.

'사용자당' 비율 제한에 관한 세부정보

다음은 Firebase AI Logic API 비율 제한 (할당량)에 관한 몇 가지 중요한 세부정보입니다. 특히 분당 요청 수 (RPM)에 관한 세부정보입니다.

  • 사용자별, 지역별, 분당 '콘텐츠 요청 생성' 수를 기준으로 하며 모델을 기반으로 하지 않습니다.

  • 이 정책은 프로젝트 수준에서 적용되며 해당 Firebase 프로젝트를 사용하는 모든 애플리케이션과 IP 주소에 적용됩니다.

  • 특히 Firebase AI Logic SDK에서 발생하는 모든 호출에 적용됩니다.

  • 기본 비율 제한은 사용자당 100RPM입니다.
    Firebase AI Logic API보다 우선 적용되는 Gemini API 제공업체의 제한사항 (위 참고)을 고려해야 합니다.

'사용자당' 비율 제한 조정

비율 제한 (할당량)을 조정하려면 소유자 및 편집자 역할에 기본적으로 포함된 serviceusage.quotas.update 권한이 있어야 합니다.

요금 한도 (할당량)를 수정하거나 한도 상향을 요청하는 방법은 다음과 같습니다.

  1. Google Cloud 콘솔에서 Firebase AI Logic API 페이지로 이동합니다.

  2. 관리를 클릭합니다.

  3. 페이지 하단에서 할당량 및 시스템 한도 탭을 클릭합니다.

  4. 기능(콘텐츠 생성 요청) 및 지역과 같이 관심 있는 할당량을 표시하도록 표를 필터링합니다.

    예를 들어 지원되는 아시아 지역에서 콘텐츠 요청을 생성하기 위한 사용자별 할당량을 보려면 필터가 다음과 같이 표시됩니다. Generate content requests + Dimension:region:asia

  5. 관심 있는 각 할당량 왼쪽에 있는 체크박스를 선택합니다.

  6. 할당량 행 끝에 있는 아이콘을 클릭한 다음 할당량 수정을 선택합니다.

  7. 할당량 변경 양식에서 다음을 수행합니다.

    1. 새 값 필드에 증가된 할당량을 입력합니다.

      이 할당량은 프로젝트 수준에서 적용되며 해당 Firebase 프로젝트를 사용하는 모든 애플리케이션과 IP 주소 전반에 공유됩니다.

    2. 양식의 추가 필드를 작성한 후 완료를 클릭합니다.

    3. 요청 제출을 클릭합니다.