All Gemini 1.0 and Gemini 1.5 models are now retired.
To avoid service disruption, update to a newer model (for example, gemini-2.5-flash-lite). Learn more.

Questa pagina è stata tradotta dall'API Cloud Translation.

Crea esperienze ibride con modelli on-device e ospitati sul cloud

Crea app e funzionalità basate sull'AI con l'inferenza ibrida utilizzando Firebase AI Logic. L'inferenza ibrida consente di eseguire l'inferenza utilizzando modelli sul dispositivo, se disponibili, e di passare senza problemi a modelli ospitati sul cloud in caso contrario (e viceversa).

Con questa release, l'inferenza ibrida è disponibile utilizzando l'SDK client Firebase AI Logic per il web con supporto per l'inferenza sul dispositivo per Chrome su computer.

Vai agli esempi di codice

Casi d'uso consigliati e funzionalità supportate

Casi d'uso consigliati:

L'utilizzo di un modello sul dispositivo per le offerte di inferenza offre:
- Maggiore privacy
- Contesto locale
- Inferenza senza costi
- Funzionalità offline
Utilizzo delle offerte di funzionalità ibride:
- Raggiungere il 100% del pubblico, indipendentemente dalla disponibilità del modello sul dispositivo o dalla connettività a internet

Funzionalità supportate per l'inferenza sul dispositivo:

Generazione di contenuti in un solo passaggio, streaming e non streaming
Generazione di testo da input di solo testo
Generazione di testo da input di testo e immagini, in particolare tipi di immagini di input JPEG e PNG
Generazione di output strutturato, inclusi JSON ed enumerazioni

Inizia

Questa guida mostra come iniziare a utilizzare l'SDK Firebase AI Logic per il web per eseguire l'inferenza ibrida.

L'inferenza che utilizza un modello sul dispositivo utilizza l'API Prompt di Chrome, mentre l'inferenza che utilizza un modello ospitato sul cloud utilizza il provider Gemini API che hai scelto (Gemini Developer API o Vertex AI Gemini API).

Inizia a sviluppare utilizzando localhost, come descritto in questa sezione (puoi anche scoprire di più sull'utilizzo delle API su localhost nella documentazione di Chrome). Una volta implementata la funzionalità, puoi abilitare gli utenti finali a provarla.

Passaggio 1: configura Chrome e l'API Prompt per l'inferenza sul dispositivo

Assicurati di utilizzare una versione recente di Chrome. Aggiorna in chrome://settings/help.
L'inferenza sul dispositivo è disponibile a partire da Chrome v139 e versioni successive.
Attiva il modello multimodale sul dispositivo impostando il seguente flag su Attivato:
- chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
Riavvia Chrome.
(Facoltativo) Scarica il modello sul dispositivo prima della prima richiesta.

L'API Prompt è integrata in Chrome, ma il modello sul dispositivo non è disponibile per impostazione predefinita. Se non hai ancora scaricato il modello prima della tua prima richiesta di inferenza on-device, la richiesta avvierà automaticamente il download del modello in background.

Nota: il download del modello può richiedere diversi minuti, quindi l'attesa del download automatico con la prima richiesta può ritardare notevolmente la ricezione di una risposta a tale richiesta.
Visualizza le istruzioni per scaricare il modello sul dispositivo
1. Apri Strumenti per sviluppatori > Console.
2. Esegui questo comando:
```
await LanguageModel.availability();
```
3. Assicurati che l'output sia available, downloading o downloadable.
4. Se l'output è downloadable, avvia il download del modello eseguendo:
```
await LanguageModel.create();
```
5. Puoi utilizzare il seguente callback monitor per monitorare l'avanzamento del download e assicurarti che il modello sia available prima di effettuare richieste:
```
const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener("downloadprogress", (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});
```

Passaggio 2: configura un progetto Firebase e connetti la tua app a Firebase

Accedi alla console Firebase, quindi seleziona il tuo progetto Firebase.
Non hai ancora un progetto Firebase?

Se non hai ancora un progetto Firebase, fai clic sul pulsante per crearne uno nuovo e poi utilizza una delle seguenti opzioni:
- Opzione 1: crea un progetto Firebase completamente nuovo (e il relativo progetto Google Cloud sottostante) inserendo un nuovo nome del progetto nel primo passaggio del flusso di lavoro.
- Opzione 2: "Aggiungi Firebase" a un progetto Google Cloud esistente facendo clic su Aggiungi Firebase al progetto Google Cloud (in fondo alla pagina). Nel primo passaggio del flusso di lavoro, inizia a inserire il nome del progetto esistente, quindi selezionalo dall'elenco visualizzato.
Completa i passaggi rimanenti del flusso di lavoro sullo schermo per creare un progetto Firebase. Tieni presente che, quando richiesto, non devi configurare Google Analytics per utilizzare gli SDK Firebase AI Logic.
Nella console Firebase, vai alla pagina Firebase AI Logic.
Fai clic su Inizia per avviare un flusso di lavoro guidato che ti aiuti a configurare le API richieste e le risorse per il tuo progetto.
Seleziona il fornitore "Gemini API" che vuoi utilizzare con gli SDK Firebase AI Logic. Gemini Developer API è consigliato per gli utenti alle prime armi. Puoi sempre aggiungere i dati di fatturazione o configurare Vertex AI Gemini API in un secondo momento, se vuoi.
- Gemini Developer API: opzione di fatturazione (disponibile con il piano tariffario Spark senza costi, con possibilità di eseguire l'upgrade in un secondo momento, se desiderato)
  La console abiliterà le API richieste e creerà una chiave API Gemini nel tuo progetto.
  Non aggiungere questa chiave API Gemini al codebase della tua app. Scopri di più.
- Vertex AI Gemini API: è richiesta la fatturazione (richiede il piano tariffario Blaze con pagamento a consumo)
  La console ti aiuterà a configurare la fatturazione e ad abilitare le API richieste nel tuo progetto.
Se richiesto nel flusso di lavoro della console, segui le istruzioni sullo schermo per registrare la tua app e connetterla a Firebase.
Continua con il passaggio successivo di questa guida per aggiungere l'SDK alla tua app.

Passaggio 3: aggiungi l'SDK

La libreria Firebase fornisce l'accesso alle API per interagire con i modelli generativi. La libreria è inclusa nell'SDK Firebase JavaScript per il web.

Installa l'SDK Firebase JS per il web utilizzando npm:
```
npm install firebase
```

Inizializza Firebase nella tua app:

import { initializeApp } from "firebase/app";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

Passaggio 4: inizializza il servizio e crea un'istanza del modello

Fai clic sul tuo fornitore Gemini API per visualizzare i contenuti e il codice specifici del fornitore in questa pagina.

Prima di inviare un prompt a un modello Gemini, inizializza il servizio per il provider API scelto e crea un'istanza GenerativeModel.

Imposta mode su uno dei seguenti valori:

PREFER_ON_DEVICE: configura l'SDK in modo che utilizzi il modello sul dispositivo, se disponibile, o esegua il failover sul modello ospitato sul cloud.
ONLY_ON_DEVICE: configura l'SDK in modo che utilizzi il modello sul dispositivo o generi un'eccezione.
PREFER_IN_CLOUD: configura l'SDK in modo che utilizzi il modello ospitato sul cloud, se disponibile, o il modello sul dispositivo.
ONLY_IN_CLOUD: configura l'SDK in modo che non utilizzi mai il modello sul dispositivo.

Quando utilizzi PREFER_ON_DEVICE, PREFER_IN_CLOUD o ONLY_IN_CLOUD, il modello predefinito ospitato su cloud è gemini-2.0-flash-lite, ma puoi ignorare il valore predefinito.

import { initializeApp } from "firebase/app";
import { getAI, getGenerativeModel, GoogleAIBackend, InferenceMode } from "firebase/ai";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

// Initialize the Gemini Developer API backend service
const ai = getAI(firebaseApp, { backend: new GoogleAIBackend() });

// Create a `GenerativeModel` instance
// Set the mode, for example to use on-device model when possible
const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_ON_DEVICE });

Inviare una richiesta di prompt a un modello

Questa sezione fornisce esempi di come inviare vari tipi di input per generare diversi tipi di output, tra cui:

Generare testo da input solo di testo
Generare testo da input di testo e immagini (multimodale)

Se vuoi generare un output strutturato (come JSON o enumerazioni), utilizza uno dei seguenti esempi di "genera testo" e, inoltre, configura il modello in modo che risponda in base a uno schema fornito.

Generare testo da input di solo testo

Prima di provare questo esempio, assicurati di aver completato la sezione Inizia di questa guida.

Puoi utilizzare generateContent() per generare testo da un prompt che contiene testo:

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Wrap in an async function so you can use await
async function run() {
  // Provide a prompt that contains text
  const prompt = "Write a story about a magic backpack."

  // To generate text output, call `generateContent` with the text input
  const result = await model.generateContent(prompt);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

Tieni presente che Firebase AI Logic supporta anche lo streaming delle risposte di testo utilizzando generateContentStream (anziché generateContent).

Genera testo da input di testo e immagini (multimodale)

Prima di provare questo esempio, assicurati di aver completato la sezione Inizia di questa guida.

Puoi utilizzare generateContent() per generare testo da un prompt contenente file di testo e immagine, fornendo il mimeType di ogni file di input e il file stesso.

I tipi di immagini di input supportati per l'inferenza sul dispositivo sono PNG e JPEG.

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Converts a File object to a Part object.
async function fileToGenerativePart(file) {
  const base64EncodedDataPromise = new Promise((resolve) => {
    const reader = new FileReader();
    reader.onloadend = () => resolve(reader.result.split(',')[1]);
    reader.readAsDataURL(file);
  });
  return {
    inlineData: { data: await base64EncodedDataPromise, mimeType: file.type },
  };
}

async function run() {
  // Provide a text prompt to include with the image
  const prompt = "Write a poem about this picture:";

  const fileInputEl = document.querySelector("input[type=file]");
  const imagePart = await fileToGenerativePart(fileInputEl.files[0]);

  // To generate text output, call `generateContent` with the text and image
  const result = await model.generateContent([prompt, imagePart]);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

Tieni presente che Firebase AI Logic supporta anche lo streaming delle risposte di testo utilizzando generateContentStream (anziché generateContent).

Cos'altro puoi fare?

Oltre agli esempi riportati sopra, puoi anche consentire agli utenti finali di provare la tua funzionalità, utilizzare modalità di inferenza alternative, eseguire l'override del modello di riserva predefinito e utilizzare la configurazione del modello per controllare le risposte.

Consentire agli utenti finali di provare la tua funzionalità

Per consentire agli utenti finali di provare la tua funzionalità, puoi registrarti alle prove dell'origine di Chrome. Tieni presente che queste prove hanno una durata e un utilizzo limitati.

Registrati alla prova dell'origine di Chrome dell'API Prompt. Ti verrà fornito un token.
Fornisci il token in ogni pagina web per cui vuoi attivare la funzionalità di prova. Utilizza una delle seguenti opzioni:
- Fornisci il token come meta tag nel tag <head>: <meta http-equiv="origin-trial" content="TOKEN">
- Fornisci il token come intestazione HTTP: Origin-Trial: TOKEN
- Fornisci il token in modo programmatico.

Utilizzare modalità di inferenza alternative

Gli esempi precedenti utilizzavano la modalità PREFER_ON_DEVICE per configurare l'SDK in modo da utilizzare un modello sul dispositivo, se disponibile, o eseguire il failover a un modello ospitato sul cloud. L'SDK offre tre modalità di inferenza alternative: ONLY_ON_DEVICE, ONLY_IN_CLOUD e PREFER_IN_CLOUD.

Utilizza la modalità ONLY_ON_DEVICE in modo che l'SDK possa utilizzare solo un modello sul dispositivo. In questa configurazione, l'API genererà un errore se non è disponibile un modello on-device.
```
const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_ON_DEVICE });
```
Utilizza la modalità ONLY_IN_CLOUD in modo che l'SDK possa utilizzare solo un modello ospitato sul cloud.
```
const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_IN_CLOUD });
```
Utilizza la modalità PREFER_IN_CLOUD in modo che l'SDK tenti di utilizzare il modello ospitato sul cloud, ma utilizzerà il modello sul dispositivo se quello ospitato sul cloud non è disponibile (ad esempio, il dispositivo è offline).
```
const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_IN_CLOUD });
```

Determinare se è stata utilizzata l'inferenza sul dispositivo o nel cloud

Se utilizzi le modalità di inferenza PREFER_ON_DEVICE o PREFER_IN_CLOUD, potrebbe essere utile sapere quale modalità è stata utilizzata per determinate richieste. Queste informazioni vengono fornite dalla proprietà inferenceSource di ogni risposta (disponibile a partire da JS SDK v12.5.0).

Quando accedi a questa proprietà, il valore restituito sarà ON_DEVICE o IN_CLOUD.

// ...

console.log('You used: ' + result.response.inferenceSource);

console.log(result.response.text());

Eseguire l'override del modello di riserva predefinito

Il modello predefinito ospitato sul cloud è gemini-2.0-flash-lite.

Questo modello è il modello di riserva ospitato sul cloud quando utilizzi la modalità PREFER_ON_DEVICE. È anche il modello predefinito quando utilizzi la modalità ONLY_IN_CLOUD o la modalità PREFER_IN_CLOUD.

Puoi utilizzare l'opzione di configurazione inCloudParams per specificare un modello alternativo predefinito ospitato sul cloud.

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  inCloudParams: {
    model: "GEMINI_MODEL_NAME"
  }
});

Trova i nomi dei modelli per tutti i modelli Gemini supportati.

Utilizzare la configurazione del modello per controllare le risposte

In ogni richiesta a un modello, puoi inviare una configurazione del modello per controllare il modo in cui il modello genera una risposta. I modelli ospitati sul cloud e i modelli sul dispositivo offrono diverse opzioni di configurazione.

La configurazione viene mantenuta per l'intera durata dell'istanza. Se vuoi utilizzare una configurazione diversa, crea una nuova istanza di GenerativeModel con quella configurazione.

Imposta la configurazione per un modello ospitato sul cloud

Utilizza l'opzione inCloudParams per configurare un modello Gemini ospitato sul cloud. Scopri di più sui parametri disponibili.

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  inCloudParams: {
    model: "GEMINI_MODEL_NAME"
    temperature: 0.8,
    topK: 10
  }
});

Impostare la configurazione per un modello on-device

Tieni presente che l'inferenza che utilizza un modello sul dispositivo utilizza l'API Prompt di Chrome.

Utilizza l'opzione onDeviceParams per configurare un modello on-device. Scopri di più sui parametri disponibili.

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  onDeviceParams: {
    createOptions: {
      temperature: 0.8,
      topK: 8
    }
  }
});

Imposta la configurazione per l'output strutturato (come JSON)

La generazione di output strutturato (come JSON ed enumerazioni) è supportata per l'inferenza utilizzando modelli ospitati sul cloud e sul dispositivo.

Per l'inferenza ibrida, utilizza sia inCloudParams sia onDeviceParams per configurare il modello in modo che risponda con un output strutturato. Per le altre modalità, utilizza solo la configurazione applicabile.

Per inCloudParams: specifica il responseMimeType appropriato (in questo esempio, application/json) e il responseSchema che vuoi che il modello utilizzi.
Per onDeviceParams: specifica responseConstraint che vuoi che il modello utilizzi.

Output JSON

Il seguente esempio adatta l'esempio di output JSON generale per l'inferenza ibrida:

import {
  getAI,
  getGenerativeModel,
  Schema
} from "firebase/ai";

const jsonSchema = Schema.object({
 properties: {
    characters: Schema.array({
      items: Schema.object({
        properties: {
          name: Schema.string(),
          accessory: Schema.string(),
          age: Schema.number(),
          species: Schema.string(),
        },
        optionalProperties: ["accessory"],
      }),
    }),
  }
});

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  inCloudParams: {
    model: "gemini-2.5-flash"
    generationConfig: {
      responseMimeType: "application/json",
      responseSchema: jsonSchema
    },
  }
  onDeviceParams: {
    promptOptions: {
      responseConstraint: jsonSchema
    }
  }
});

Output enum

Come sopra, ma adattando la documentazione sull'output enum per l'inferenza ibrida:

// ...

const enumSchema = Schema.enumString({
  enum: ["drama", "comedy", "documentary"],
});

const model = getGenerativeModel(ai, {

// ...

    generationConfig: {
      responseMimeType: "text/x.enum",
      responseSchema: enumSchema
    },

// ...
});

// ...

Funzionalità non ancora disponibili per l'inferenza sul dispositivo

In quanto release sperimentale, non tutte le funzionalità dell'SDK web sono disponibili per l'inferenza on-device. Le seguenti funzionalità non sono ancora supportate per l'inferenza on-device (ma sono solitamente disponibili per l'inferenza basata sul cloud).

Generazione di testo da tipi di input di file immagine diversi da JPEG e PNG
- Può eseguire il fallback al modello ospitato sul cloud; tuttavia, la modalità ONLY_ON_DEVICE genererà un errore.
Generazione di testo da input audio, video e documenti (come i PDF)
- Può eseguire il fallback al modello ospitato sul cloud; tuttavia, la modalità ONLY_ON_DEVICE genererà un errore.
Generare immagini utilizzando i modelli Gemini o Imagen
- Può eseguire il fallback al modello ospitato sul cloud; tuttavia, la modalità ONLY_ON_DEVICE genererà un errore.
Fornire file utilizzando URL nelle richieste multimodali. Devi fornire i file come dati incorporati ai modelli sul dispositivo.
Chat multi-turno
- Può eseguire il fallback al modello ospitato sul cloud; tuttavia, la modalità ONLY_ON_DEVICE genererà un errore.
Streaming bidirezionale con Gemini Live API
Fornire al modello strumenti per aiutarlo a generare la risposta (ad esempio chiamata di funzioni, esecuzione di codice e fondatezza con la Ricerca Google)
Contare i token
- Genera sempre un errore. Il conteggio sarà diverso tra i modelli ospitati sul cloud e quelli sul dispositivo, quindi non esiste un fallback intuitivo.
Monitoraggio dell'AI nella console Firebase per l'inferenza on-device.
- Tieni presente che qualsiasi inferenza che utilizza i modelli ospitati sul cloud può essere monitorata proprio come altre inferenze che utilizzano l'SDK client Firebase AI Logic per il web.

Fornisci un feedback sulla tua esperienza con Firebase AI Logic