Fai clic sul tuo fornitore Gemini API per visualizzare i contenuti e il codice specifici del fornitore in questa pagina. |
I limiti di frequenza (chiamati comunemente quote) regolano il numero di richieste che puoi effettuare al Gemini API in un determinato periodo di tempo. Questi limiti contribuiscono a garantire un utilizzo corretto, a proteggere da abusi e a mantenere le prestazioni del sistema per tutti gli utenti.
Quando utilizzi Firebase AI Logic per inviare richieste ai modelli Gemini e Imagen, i limiti di frequenza del progetto dipendono dal fornitore di "Gemini API" scelto. Firebase AI Logic offre anche un modo per impostare limiti di frequenza "per utente".
Visualizzare i limiti di tariffa per il Gemini Developer API
Come funzionano i limiti di frequenza (quote)
I limiti di frequenza (quote) vengono misurati in quattro dimensioni:
- Richieste al minuto (RPM)
- Richieste al giorno (RPD)
- Token al minuto (TPM)
- Token al giorno (TPD)
Il tuo utilizzo viene valutato in base a ciascun limite e il superamento di uno di questi attiverà un errore 429 di quota superata. Ad esempio, se il limite di RPM è 20, effettuare 21 richieste in un minuto comporterà un errore, anche se non hai superato il TPM o altri limiti.
I limiti di frequenza vengono applicati a livello di progetto e a tutte le applicazioni e gli indirizzi IP che utilizzano il progetto Firebase.
I limiti variano a seconda del modello specifico utilizzato e alcuni si applicano solo a modelli specifici. Ad esempio, le immagini al minuto (IPM) vengono calcolate solo per i modelli in grado di generare immagini (Imagen 3), ma sono concettualmente simili alle TPM.
I limiti di frequenza sono più restrittivi per i modelli sperimentali e di anteprima.
Richiedere un aumento del limite di frequenza delle richieste
Se utilizzi un "livello a pagamento" per Gemini Developer API, puoi richiedere un aumento del limite di frequenza.
Impostare limiti di frequenza "per utente"
Per utilizzare Firebase AI Logic, il progetto deve avere attivato il fornitore Gemini API scelto, ma è necessario anche attivare l'API Firebase AI Logic, che funge da gateway tra i nostri SDK client e il fornitore Gemini API. Questa API viene attivata durante la configurazione iniziale di Firebase AI Logic nel tuo progetto Firebase.
Puoi utilizzare il limite di frequenza (quota) dell'API Firebase AI Logic come limite di frequenza "per utente" per la tua app, in particolare per le funzionalità di IA che si basano su Firebase AI Logic. Devi impostare questo limite in modo ragionevole per consentire a un singolo utente di accedere alle tue funzionalità di IA, assicurandoti al contempo che nessun singolo utente superi i limiti del tuo fornitore Gemini API (che è destinato a essere condiviso da tutti gli utenti).
Dettagli sul limite di frequenza "per utente"
Di seguito sono riportati alcuni dettagli importanti sui limiti di frequenza (quote) dell'Firebase AI LogicAPI, in particolare sulle richieste al minuto (RPM):
Si basa su "Generare richieste di contenuti" su base per utente, per regione e per minuto e non sul modello.
Si applica a livello di progetto e a tutte le applicazioni e gli indirizzi IP che utilizzano il progetto Firebase.
Si applica a qualsiasi chiamata proveniente specificamente da qualsiasi SDKFirebase AI Logic.
Il limite di frequenza predefinito è 100 RPM per utente.
Tieni presente che devi comunque prendere in considerazione i limiti del tuo fornitore Gemini API (vedi sopra), che hanno la precedenza sull'API Firebase AI Logic.
Modificare il limite di frequenza "per utente"
Per modificare un limite di frequenza (quota), devi disporre dell'autorizzazione serviceusage.quotas.update
, inclusa per impostazione predefinita nei ruoli Proprietario ed Editor.
Ecco come modificare il limite di frequenza (quota) o richiederne un aumento:
Nella console Google Cloud, vai alla pagina relativa all'API Firebase AI Logic.
Fai clic su Gestisci.
Più in basso nella pagina, fai clic sulla scheda Quote e Limiti di sistema.
Filtra la tabella per visualizzare le quote di interesse, ad esempio la funzionalità (richieste di generazione di contenuti) e la regione.
Ad esempio, per visualizzare le quote per utente per la generazione di richieste di contenuti in una delle regioni asiatiche supportate, il filtro sarà simile a questo:
Generate content requests
+Dimension:region:asia
Seleziona la casella di controllo a sinistra di ogni quota che ti interessa.
Alla fine della riga della quota, fai clic su
, poi seleziona Modifica quota.Nel modulo Modifiche alla quota, segui questi passaggi:
Inserisci la quota aumentata nel campo Nuovo valore.
Questa quota si applica a livello di progetto e viene condivisa tra tutte le applicazioni e gli indirizzi IP che utilizzano il progetto Firebase.
Compila eventuali campi aggiuntivi nel modulo, poi fai clic su Fine.
Fai clic su Invia richiesta.