このページは Cloud Translation API によって翻訳されました。

オンデバイスモデルとクラウドホストモデルを使用してハイブリッドエクスペリエンスを構築する

Firebase AI Logic を使用してハイブリッド推論で AI を活用したアプリや機能を構築します。ハイブリッド推論では、利用可能な場合はデバイス上のモデルを使用して推論を実行し、それ以外の場合はクラウドホスト型のモデルにシームレスにフォールバックできます。

このリリースでは、Firebase AI Logic クライアント SDK for Web を使用してハイブリッド推論を利用できます。この SDK は、デスクトップ版 Chrome のオンデバイス推論をサポートしています。

コード例に移動

推奨されるユースケースとサポートされている機能

推奨されるユースケース:

推論にデバイスモデルを使用すると、次のメリットがあります。
- プライバシーの強化
- ローカルコンテキスト
- 無料の推論
- オフライン機能
ハイブリッド機能の特典を利用する:
- デバイスモデルの利用可能性に関係なく、オーディエンスの 100% にリーチ

オンデバイス推論でサポートされている機能:

単一ターンのコンテンツ生成（ストリーミングと非ストリーミング）
テキストのみの入力からテキストを生成する
テキストと画像の入力からテキストを生成する（特に JPEG と PNG の入力画像タイプ）
JSON や列挙型などの構造化出力を生成する

始める

このガイドでは、Firebase AI Logic SDK for Web を使用してハイブリッド推論を開始する方法について説明します。

オンデバイスモデルを使用する推論では Chrome の Prompt API が使用されます。一方、クラウドホスト型モデルを使用する推論では、選択した Gemini API プロバイダ（Gemini Developer API または Vertex AI Gemini API）が使用されます。

このセクションの説明に沿って、localhost を使用した開発を開始します（localhost での API の使用について詳しくは、Chrome のドキュメントをご覧ください）。機能を実装したら、必要に応じてエンドユーザーが機能を試せるようにすることができます。

ステップ 1: オンデバイス推論用に Chrome と Prompt API を設定する

最新バージョンの Chrome を使用していることを確認します。chrome://settings/help で更新します。
オンデバイス推論は Chrome v139 以降で利用できます。
次のフラグを [有効] に設定して、オンデバイスマルチモーダルモデルを有効にします。
- chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
Chrome を再起動します。
（省略可）最初のリクエストの前にオンデバイスモデルをダウンロードします。

Prompt API は Chrome に組み込まれていますが、オンデバイスモデルはデフォルトでは利用できません。オンデバイス推論の初回リクエストの前にモデルをまだダウンロードしていない場合、リクエストによりバックグラウンドでモデルのダウンロードが自動的に開始されます。

注: モデルのダウンロードには数分かかることがあります。そのため、最初のリクエストで自動ダウンロードを待つと、そのリクエストに対するレスポンスの受信が大幅に遅れる可能性があります。
オンデバイスモデルをダウンロードする手順を表示する
1. [デベロッパーツール] > [コンソール] を開きます。
2. 以下のコマンドを実行します。
```
await LanguageModel.availability();
```
3. 出力が available、downloading、downloadable のいずれかであることを確認します。
4. 出力が downloadable の場合は、次のコマンドを実行してモデルのダウンロードを開始します。
```
await LanguageModel.create();
```
5. 次の monitor コールバックを使用して、ダウンロードの進行状況をリッスンし、リクエストを行う前にモデルが available であることを確認できます。
```
const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener("downloadprogress", (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});
```

ステップ 2: Firebase プロジェクトを設定し、アプリを Firebase に接続する

Firebase コンソールにログインし、Firebase プロジェクトを選択します。
Firebase プロジェクトをまだ作成していない場合

Firebase プロジェクトをまだ作成していない場合は、ボタンをクリックして新しい Firebase プロジェクトを作成し、次のいずれかのオプションを使用します。
- オプション 1: ワークフローの最初のステップで新しいプロジェクト名を入力して、完全に新しい Firebase プロジェクト（およびその基盤となる Google Cloud プロジェクトを自動的に）を作成します。
- オプション 2: ページの下部にある [Google Cloud プロジェクトに Firebase を追加] をクリックして、既存の Google Cloud プロジェクトに「Firebase を追加」します。ワークフローの最初のステップで、既存のプロジェクトのプロジェクト名を入力し、表示されたリストからプロジェクトを選択します。
画面上のワークフローの残りの手順を完了して、Firebase プロジェクトを作成します。プロンプトが表示されたら、Firebase AI Logic SDK を使用するように Google Analytics を設定する必要はありません。
Firebase コンソールで、[Firebase AI Logic] ページに移動します。
[使ってみる] をクリックして、プロジェクトに必要な API とリソースの設定に役立つガイド付きワークフローを起動します。
Firebase AI Logic SDK で使用する Gemini API プロバイダを選択します。Gemini Developer API は、初めて使用するユーザーにおすすめです。請求先を追加したり、Vertex AI Gemini API を後で設定したりすることもできます。
- Gemini Developer API - 課金は任意（無料の Spark 料金プランで利用可能。必要に応じて後でアップグレードできます）
  コンソールで必要な API が有効になり、プロジェクトに Gemini API キーが作成されます。
  この Gemini API キーをアプリのコードベースに追加しないでください。詳細
- Vertex AI Gemini API - 課金が必要（従量課金制の Blaze 料金プランが必要）
  コンソールで、課金を設定し、プロジェクトで必要な API を有効にできます。
コンソールのワークフローでプロンプトが表示されたら、画面上の指示に沿ってアプリを登録し、Firebase に接続します。
このガイドの次のステップに進み、SDK をアプリに追加します。

ステップ 3: SDK を追加する

Firebase ライブラリは、生成モデルを操作するための API へのアクセスを提供します。このライブラリは、Firebase JavaScript SDK for Web の一部として含まれています。

npm を使用してウェブ用の Firebase JS SDK をインストールします。
```
npm install firebase
```

アプリで Firebase を初期化します。

import { initializeApp } from "firebase/app";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

ステップ 4: サービスを初期化してモデルインスタンスを作成する

Gemini API プロバイダをクリックして、このページでプロバイダ固有のコンテンツとコードを表示します。

Gemini モデルにプロンプトを送信する前に、選択した API プロバイダのサービスを初期化して、GenerativeModel インスタンスを作成します。

mode を次のいずれかに設定します。

PREFER_ON_DEVICE: 利用可能な場合はデバイス上のモデルを使用し、利用できない場合はクラウドホスト型のモデルにフォールバックするように SDK を構成します。
ONLY_ON_DEVICE: オンデバイスモデルを使用するか、例外をスローするように SDK を構成します。
ONLY_IN_CLOUD: オンデバイスモデルを絶対に使用しないように SDK を構成します。

デフォルトでは、PREFER_ON_DEVICE または ONLY_IN_CLOUD を使用すると、クラウドホスト型モデルは gemini-2.0-flash-lite になりますが、デフォルトをオーバーライドできます。

import { initializeApp } from "firebase/app";
import { getAI, getGenerativeModel, GoogleAIBackend, InferenceMode } from "firebase/ai";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

// Initialize the Gemini Developer API backend service
const ai = getAI(firebaseApp, { backend: new GoogleAIBackend() });

// Create a `GenerativeModel` instance
// Set the mode, for example to use on-device model when possible
const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_ON_DEVICE });

モデルにプロンプトリクエストを送信する

このセクションでは、さまざまな種類の入力を送信してさまざまな種類の出力を生成する方法の例を示します。

テキストのみの入力からテキストを生成する
テキストと画像（マルチモーダル）の入力からテキストを生成する

構造化された出力（JSON や列挙型など）を生成する場合は、次の「テキストの生成」の例のいずれかを使用し、さらに提供されたスキーマに従って応答するようにモデルを構成します。

テキストのみの入力からテキストを生成する

このサンプルを試す前に、このガイドのスタートガイドセクションを完了していることを確認してください。

generateContent() を使用すると、テキストを含むプロンプトからテキストを生成できます。

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Wrap in an async function so you can use await
async function run() {
  // Provide a prompt that contains text
  const prompt = "Write a story about a magic backpack."

  // To generate text output, call `generateContent` with the text input
  const result = await model.generateContent(prompt);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

なお、Firebase AI Logic は generateContent ではなく generateContentStream を使用したテキストレスポンスのストリーミングもサポートしています。

テキストと画像（マルチモーダル）入力からテキストを生成する

このサンプルを試す前に、このガイドのスタートガイドセクションを完了していることを確認してください。

generateContent() を使用すると、テキストと画像ファイルを含むプロンプトからテキストを生成できます。各入力ファイルの mimeType とファイル自体を指定します。

オンデバイス推論でサポートされている入力画像タイプは PNG と JPEG です。

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Converts a File object to a Part object.
async function fileToGenerativePart(file) {
  const base64EncodedDataPromise = new Promise((resolve) => {
    const reader = new FileReader();
    reader.onloadend = () => resolve(reader.result.split(',')[1]);
    reader.readAsDataURL(file);
  });
  return {
    inlineData: { data: await base64EncodedDataPromise, mimeType: file.type },
  };
}

async function run() {
  // Provide a text prompt to include with the image
  const prompt = "Write a poem about this picture:";

  const fileInputEl = document.querySelector("input[type=file]");
  const imagePart = await fileToGenerativePart(fileInputEl.files[0]);

  // To generate text output, call `generateContent` with the text and image
  const result = await model.generateContent([prompt, imagePart]);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

なお、Firebase AI Logic は generateContent ではなく generateContentStream を使用したテキストレスポンスのストリーミングもサポートしています。

Google アシスタントの機能

上記の例に加えて、エンドユーザーが機能を試せるようにする、代替の推論モードを使用する、デフォルトのフォールバックモデルをオーバーライドする、モデル構成を使用してレスポンスを制御することもできます。

エンドユーザーが機能を試せるようにする

エンドユーザーが機能を試せるようにするには、Chrome オリジントライアルに登録します。なお、これらのトライアルには期間と使用量の制限があります。

Prompt API Chrome オリジントライアルに登録します。トークンが発行されます。
トライアル機能を有効にする各ウェブページでトークンを指定します。以下のいずれかの方法を選択します。
- <head> タグのメタタグとしてトークンを指定します。 <meta http-equiv="origin-trial" content="TOKEN">
- トークンを HTTP ヘッダーとして指定します。 Origin-Trial: TOKEN
- トークンをプログラムで提供します。

代替の推論モードを使用する

上記の例では、PREFER_ON_DEVICE モードを使用して、オンデバイスモデルが利用可能な場合はそれを使用し、利用できない場合はクラウドホスト型モデルにフォールバックするように SDK を構成しました。SDK には、ONLY_ON_DEVICE と ONLY_IN_CLOUD の 2 つの代替推論モードが用意されています。

SDK がオンデバイスモデルのみを使用できるように、ONLY_ON_DEVICE モードを使用します。この構成では、オンデバイスモデルが利用できない場合、API はエラーをスローします。
```
const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_ON_DEVICE });
```
SDK がクラウドホスト型モデルのみを使用できるように、ONLY_IN_CLOUD モードを使用します。
```
const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_IN_CLOUD });
```

デフォルトのフォールバックモデルをオーバーライドする

PREFER_ON_DEVICE モードを使用すると、デバイス上のモデルが使用できない場合、SDK はクラウドでホストされているモデルの使用にフォールバックします。デフォルトのフォールバッククラウドホスト型モデルは gemini-2.0-flash-lite です。このクラウドホスト型モデルは、ONLY_IN_CLOUD モードを使用する場合のデフォルトでもあります。

inCloudParams 構成オプションを使用して、別のデフォルトのクラウドホスト型モデルを指定できます。

const model = getGenerativeModel(ai, {
  mode: InferenceMode.PREFER_ON_DEVICE,
  inCloudParams: {
    model: "gemini-2.5-flash"
  }
});

サポートされているすべての Gemini モデルのモデル名を確認します。

モデル構成を使用してレスポンスを制御する

モデルへのリクエストごとに、モデルがどのようにレスポンスを生成するかを制御するモデル構成を送信できます。クラウドホスト型モデルとオンデバイスモデルでは、構成オプションが異なります。

構成はインスタンスの存続期間中維持されます。別の構成を使用する場合は、その構成で新しい GenerativeModel インスタンスを作成します。

クラウドホスト型モデルの構成を設定する

inCloudParams オプションを使用して、クラウドホスト型の Gemini モデルを構成します。使用可能なパラメータについて学習する。

const model = getGenerativeModel(ai, {
  mode: InferenceMode.PREFER_ON_DEVICE,
  inCloudParams: {
    model: "gemini-2.5-flash"
    temperature: 0.8,
    topK: 10
  }
});

オンデバイスモデルの構成を設定する

オンデバイスモデルを使用した推論では、Chrome の Prompt API が使用されます。

onDeviceParams オプションを使用して、デバイス上のモデルを構成します。使用可能なパラメータについて学習する。

const model = getGenerativeModel(ai, {
  mode: InferenceMode.PREFER_ON_DEVICE,
  onDeviceParams: {
    createOptions: {
      temperature: 0.8,
      topK: 8
    }
  }
});

構造化出力（JSON など）の構成を設定する

クラウドホスト型モデルとオンデバイスモデルの両方を使用した推論で、構造化出力（JSON や列挙型など）の生成がサポートされています。

ハイブリッド推論では、inCloudParams と onDeviceParams の両方を使用して、構造化された出力を返すようにモデルを構成します。他のモードでは、該当する構成のみを使用します。

inCloudParams の場合: 適切な responseMimeType（この例では application/json）と、モデルで使用する responseSchema を指定します。
onDeviceParams の場合: モデルで使用する responseConstraint を指定します。

JSON 出力

次の例では、ハイブリッド推論用に一般的な JSON 出力の例を調整しています。

import {
  getAI,
  getGenerativeModel,
  Schema
} from "firebase/ai";

const jsonSchema = Schema.object({
 properties: {
    characters: Schema.array({
      items: Schema.object({
        properties: {
          name: Schema.string(),
          accessory: Schema.string(),
          age: Schema.number(),
          species: Schema.string(),
        },
        optionalProperties: ["accessory"],
      }),
    }),
  }
});

const model = getGenerativeModel(ai, {
  mode: InferenceMode.PREFER_ON_DEVICE,
  inCloudParams: {
    model: "gemini-2.5-flash"
    generationConfig: {
      responseMimeType: "application/json",
      responseSchema: jsonSchema
    },
  }
  onDeviceParams: {
    promptOptions: {
      responseConstraint: jsonSchema
    }
  }
});

列挙型の出力

上記と同様ですが、ハイブリッド推論用に列挙型出力に関するドキュメントを調整します。

// ...

const enumSchema = Schema.enumString({
  enum: ["drama", "comedy", "documentary"],
});

const model = getGenerativeModel(ai, {

// ...

    generationConfig: {
      responseMimeType: "text/x.enum",
      responseSchema: enumSchema
    },

// ...
});

// ...

オンデバイス推論でまだ利用できない機能

試験運用版として、Web SDK のすべての機能がオンデバイス推論で利用できるわけではありません。次の機能は、オンデバイス推論ではまだサポートされていません（通常はクラウドベースの推論で利用できます）。

JPEG と PNG 以外の画像ファイル入力タイプからテキストを生成する
- クラウドホスト型モデルにフォールバックできますが、ONLY_ON_DEVICE モードではエラーがスローされます。
音声、動画、ドキュメント（PDF など）の入力からテキストを生成する
- クラウドホスト型モデルにフォールバックできますが、ONLY_ON_DEVICE モードではエラーがスローされます。
Gemini モデルまたは Imagen モデルを使用して画像を生成する
- クラウドホスト型モデルにフォールバックできますが、ONLY_ON_DEVICE モードではエラーがスローされます。
マルチモーダルリクエストで URL を使用してファイルを提供する。ファイルは、オンデバイスモデルにインラインデータとして提供する必要があります。
マルチターンチャット
- クラウドホスト型モデルにフォールバックできますが、ONLY_ON_DEVICE モードではエラーがスローされます。
Gemini Live API を使用した双方向ストリーミング
- これは、Firebase AI Logic クライアント SDK for Web では、クラウドホスト型モデルであってもサポートされていません。
「ツール」の使用（関数呼び出しや Google 検索によるグラウンディングなど）
- 近日提供予定
トークンのカウント
- 常にエラーをスローします。クラウドホスト型モデルとオンデバイスモデルではカウントが異なるため、直感的なフォールバックはありません。
デバイス上の推論のための Firebase コンソールの AI モニタリング。
- クラウドホスト型モデルを使用する推論は、Firebase AI Logic クライアント SDK for Web を使用する他の推論と同様にモニタリングできます。

Firebase AI Logic の使用感についてフィードバックを送信する