サポートされているモデルの詳細

モバイルアプリとウェブアプリの場合、Firebase AI Logic SDK を使用すると、サポートされている Gemini モデルImagen モデルをアプリから直接操作できます。

Gemini モデルは、テキスト、コード、PDF、画像、動画、音声など、複数のモダリティを処理し、生成することもできるため、マルチモーダルと見なされます。Imagen モデルは、テキストでプロンプトして画像を生成できます。

次の表は、Firebase AI Logic でサポートされているモデルと、その最新の安定版モデル名の簡単な概要です。この表には、ユースケースのプロトタイピングに使用できるプレビュー版と試験運用版のモデルも記載されています。

また、Firebase AI Logic がサポートしているモデルとサポートしていないモデルに関するよくある質問もご確認ください。

Gemini 個のモデル

モデル 入力 出力 説明
安定版の Gemini モデル
Gemini 2.5 Pro
gemini-2.5-pro
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON 複雑な問題を解決できる、Google の最先端の推論モデル。
Gemini 2.5 Flash
gemini-2.5-flash
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON 優れた多機能性を備えた Google の思考モデル。価格とパフォーマンスのバランスが取れるように設計されています。
Gemini 2.0 Flash
gemini-2.0-flash-001
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON 優れたスピード、組み込みツールの使用、100 万トークンのコンテキスト ウィンドウなど、次世代の機能と改善された機能を備えたマルチモーダル モデル
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON 最も高速で費用対効果の高い Flash モデル。価格と速度はそのままに品質の向上を求めている 1.5 Flash ユーザー向けのアップグレード パスです。
プレビュー版と試験運用版のみGemini モデル (プロトタイピングのユースケースにのみ推奨)
Gemini 2.5 Flash‑Lite
gemini-2.5-flash-lite-preview-06-17
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON 低レイテンシのユースケース向けに最適化された、最もバランスの取れた Gemini モデル。
Gemini 2.0 Flash Image Generation
gemini-2.0-flash-preview-image-generation
テキスト、コード、PDF、画像、動画、音声 画像、テキスト、画像 マルチモーダル入力と画像出力をサポートするマルチモーダル モデル。
Gemini 2.0 Flash Live 1
gemini-2.0-flash-live-preview-04-09
テキスト(ストリーミング)、
音声(ストリーミング)
テキスト(ストリーミング)、
音声(ストリーミング)
マルチモーダル入力と出力の低レイテンシのリアルタイム ストリーミングをサポートするマルチモーダル モデル。

1 Firebase AI Logic SDK で Gemini Developer API を使用する場合はサポートされていません。

Imagen 個のモデル

モデル 入力 出力 説明
安定版の Imagen モデル
Imagen 3
imagen-3.0-generate-002
テキスト 画像 自然言語テキスト プロンプトからリアルで高品質な画像を生成します
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
テキスト 画像 プロトタイピングや低レイテンシのユースケース用の画像を生成します。
プレビュー版と試験運用版のみImagen モデル (プロトタイピングのユースケースにのみ推奨)
Imagen 4 2
imagen-4.0-generate-preview-06-06
テキスト 画像 自然言語テキスト プロンプトからリアルで高品質な画像を生成します
Imagen 4 Fast 2
imagen-4.0-fast-generate-preview-06-06
テキスト 画像 プロトタイピングや低レイテンシのユースケース用の画像を生成します。
Imagen 4 Ultra 2
imagen-4.0-ultra-generate-preview-06-06
テキスト 画像 自然言語テキスト プロンプトからリアルで高品質な画像を生成します

2 この Imagen モデルは、API へのアクセス方法に関係なく、Gemini Developer API でサポートされていません。


このページの残りの部分では、Firebase AI Logic でサポートされているモデルについて詳しく説明します。

このページの下部で、以前のモデルの詳細情報を確認できます。



モデルの比較

各モデルには、さまざまなユースケースに対応するための異なる機能があります。このセクションの各表では、Firebase AI Logic とともに使用した場合の各モデルについて説明します。各モデルには、SDK を使用する際には利用できない追加機能がある場合があります。

次のサブセクションで必要な情報が見つからない場合は、選択した API プロバイダのドキュメントで詳細を確認してください。

サポートされている入出力

Firebase AI Logic で各モデルを使用する場合、サポートされている入出力の型は次のとおりです。

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
画像生成 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
入力値の型
テキスト
テキスト(ストリーミング)
コード
ドキュメント
(PDF またはプレーン テキスト)
画像
動画
音声
音声(ストリーミング)
出力タイプ
テキスト
テキスト(ストリーミング)
コード
構造化された出力
(JSON など)
画像
音声
音声(ストリーミング)

サポートされているファイル形式については、サポートされている入力ファイルと要件をご覧ください。

サポートされている機能

Firebase AI Logic で各モデルを使用する場合にサポートされる機能は次のとおりです。

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
画像生成 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
テキストのみの入力またはマルチモーダル入力からテキストを生成する インターリーブまたは画像の一部として ストリーミングのみ
画像を生成する
Gemini または Imagen
音声を生成する ストリーミングのみ
構造化出力
(JSON など)を生成する
ドキュメントを分析する
(PDF またはプレーン テキスト)
画像を分析する (vision)
動画を分析する(ビジョン)
音声を分析する ストリーミングのみ
マルチターン チャット
関数呼び出し(ツール)
トークンをカウントする
システム指示
双方向マルチモーダル ストリーミング

仕様と制限事項

Firebase AI Logic で各モデルを使用する場合の仕様と制限事項は次のとおりです。

プロパティ <span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash
画像生成 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
コンテキスト ウィンドウ *
トークンの合計上限
(入力と出力の合計)
1,048,576 個のトークン 1,048,576 個のトークン 1,048,576 個のトークン 1,048,576 個のトークン 1,048,576 個のトークン 32,768 個のトークン 32,768 個のトークン 480 トークン
出力トークンの上限 * 65,536 個のトークン 65,536 個のトークン 65,536 個のトークン 8,192 個のトークン 8,192 個のトークン 8,192 個のトークン 8,192 個のトークン ---
ナレッジ カットオフ日 2025 年 1 月 2025 年 1 月 2025 年 1 月 2024 年 6 月 2024 年 6 月 2024 年 8 月 2024 年 8 月 ---
PDF(リクエストごと)
入力 PDF ファイルの最大数
**
3,000 ファイル 3,000 ファイル 3,000 ファイル 3,000 ファイル 3,000 ファイル 3,000 ファイル --- ---
入力 PDF ファイルあたりの最大ページ数

**
1,000 ページ 1,000 ページ 1,000 ページ 1,000 ページ 1,000 ページ 1,000 ページ --- ---
入力 PDF ファイルあたりの最大サイズ
50 MB 50 MB 50 MB 50 MB 50 MB 50 MB --- ---
画像(リクエストあたり)
入力画像の最大数
3,000 個の画像 3,000 個の画像 3,000 個の画像 3,000 個の画像 3,000 個の画像 3,000 個の画像 --- ---

出力画像の最大数
--- --- --- --- --- 10 枚の画像 --- 4 枚
入力された base64 エンコード画像の最大サイズ
7 MB 7 MB 7 MB 7 MB 7 MB 7 MB --- ---
動画(リクエストごと)
入力動画ファイルの最大数
10 個のファイル 10 個のファイル 10 個のファイル 10 個のファイル 10 個のファイル 10 個のファイル --- ---
すべての入力動画の最大長
(フレームのみ)
~ 60 分 ~ 60 分 ~ 60 分 ~ 60 分 ~ 60 分 ~ 60 分 --- ---
すべての入力動画
(フレーム + 音声)の最大長
45 分程度 45 分程度 45 分程度 45 分程度 45 分程度 45 分程度 --- ---
音声(リクエストごと)
入力音声ファイルの最大数
1 個のファイル 1 個のファイル 1 個のファイル 1 個のファイル 1 個のファイル 1 個のファイル --- ---
出力音声ファイルの最大数
--- --- --- --- --- --- --- ---
すべての入力音声の最大長
~ 8.4 時間 ~ 8.4 時間 ~ 8.4 時間 ~ 8.4 時間 ~ 8.4 時間 ~ 8.4 時間 --- ---
すべての出力音声の最大長
--- --- --- --- --- --- --- ---

* すべての Gemini モデルでは、1 個のトークンは約 4 文字に相当するため、100 個のトークンは約 60 ~ 80 ワード(英語)です。Gemini モデルの場合、countTokens を使用して、リクエスト内のトークンの合計数を特定できます。

** PDF は画像として扱われるため、PDF の 1 ページは 1 つの画像として扱われます。リクエストで許可されるページ数は、モデルがサポートできる画像の数に制限されます。

詳細情報を確認する



モデルのバージョニングと命名パターン

モデルは、安定版プレビュー版試験運用版で提供されます。便宜上、明示的なバージョン値のないエイリアスがサポートされています。

コードで使用する特定のモデル名については、このページの後半の「使用可能なモデル名」セクションをご覧ください。

バージョンの種類 /
リリース ステージ
説明 モデル名のパターン
Stable 安定版は、リリース日から本番環境での使用が可能になり、サポートされます。

通常、安定版のモデル バージョンは、モデルが利用可能な最終日を示す廃止日とともにリリースされます。この日を過ぎると、モデルにアクセスできなくなり、Google のサポートも受けられなくなります。

  • Gemini 2.5 モデル
    安定版のモデル名には接尾辞がありません。

    例: gemini-2.5-pro

  • Gemini 2.0 モデルと Imagen モデル
    安定版のモデル名には、特定の 3 桁のバージョン番号が付加されます。

    例: gemini-2.0-flash-001
    例: imagen-3.0-generate-002

自動更新された安定版エイリアス
Gemini 2.0 モデルのみ)
自動更新安定版エイリアスは、常にそのモデルの最新の安定版を指します。新しい安定版がリリースされると、自動更新エイリアスは自動的にその新しい安定版を指すようになります。

Gemini 2.0 モデルのみ
エイリアスのモデル名に接尾辞がない

例: gemini-2.0-flash

プレビュー プレビュー版には新しい機能が搭載されていますが、安定版ではないと見なされます。

これらのモデルは本番環境での使用には推奨されません。レート上限が厳しく、課金要件が適用される場合があります。

Vertex AI Gemini API の場合、2025 年 6 月以降にリリースされたプレビュー モデルでは、通常、モデルのロケーションを global に設定する必要があります。

プレビュー バージョンのモデル名には、モデルのリリース日(-MM-DD)とともに -preview が追加されます。

例: gemini-2.5-flash-preview-04-17
(2025 年 4 月 17 日リリース)

試験運用版 試験運用バージョンには新しい機能が搭載されており、安定していないと見なされます。

これらのモデルは本番環境での使用には推奨されず、より厳しいレート制限が適用されます。試験運用版モデルは、フィードバックを収集し、最新機能のテストを可能にすることを目的としています。

Vertex AI Gemini API の場合、2025 年 6 月以降にリリースされた試験運用モデルでは、モデルのロケーションを global に設定する必要があります。

試験運用版のモデル名には、モデルのリリース日(-MM-DD)とともに -exp が付加されます。

例: gemini-2.5-pro-exp-03-25
(2025 年 3 月 25 日リリース)

Retired 廃止されたバージョンは、廃止日を過ぎており、完全に無効になっています。

廃止されたモデルは、Google からアクセスすることもサポートを受けることもできません。通常、廃止されたモデル ID を参照するリクエストは 404 エラーを返します。

---



使用可能なモデル名

モデル名は、モデルの初期化時にコードに含める明示的な値です。

使用可能なすべてのモデルをプログラムで一覧表示する

REST API を使用して、使用可能なすべてのモデル名を一覧表示できます。

返されるリストには、API プロバイダがサポートするすべてのモデルが含まれますが、Firebase AI Logic はこのページで説明する Gemini モデルと Imagen モデルのみをサポートします。また、自動更新エイリアス(gemini-2.0-flash など)は基本モデルの便利なエイリアスであるため、一覧表示されません。

Gemini 個のモデル名

プラットフォームの初期化の例については、スタートガイドをご覧ください。

リリース ステージ(特にユースケースと課金)の詳細については、モデルのバージョニングと命名パターンをご覧ください。

Gemini 2.5 Pro 個のモデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.5-pro Gemini 2.5 Pro の最新の安定版 Stable 2025-06-17
2026 年 6 月 17 日以降
gemini-2.5-pro-preview-06-05 Gemini 2.5 Pro
最新の安定版(現在は gemini-2.5-pro)を指すプレビュー版
プレビュー 2025-06-05
2025 年 7 月 15 日以降
gemini-2.5-pro-preview-05-06 Gemini 2.5 Pro*
最新の安定版を指すプレビュー版(現在は gemini-2.5-pro
プレビュー 2025-05-06
2025 年 7 月 15 日以降
gemini-2.5-pro-preview-03-25 Gemini 2.5 Pro*
最新の安定版を指すプレビュー版(現在は gemini-2.5-pro
プレビュー 2025 年 3 月 25 日
2025 年 7 月 15 日以降

* Gemini 2.5 Pro モデルの既存のプレビュー バージョンは、2025 年 6 月 19 日に安定版を指すようになります。

Gemini 2.5 Flash 個のモデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.5-flash Gemini 2.5 Flash の最新の安定版 Stable 2025-06-17
2026 年 6 月 17 日以降
gemini-2.5-flash-preview-05-20 Gemini 2.5 Flash
最新の安定版(現在は gemini-2.5-flash)を指すプレビュー版
プレビュー 2025-05-20
2025 年 7 月 15 日以降
gemini-2.5-flash-preview-04-17 Gemini 2.5 Flash*
最新の安定版を指すプレビュー版(現在は gemini-2.5-flash
プレビュー 2025-04-17
2025 年 7 月 15 日以降

* Gemini 2.5 Flash モデルの既存のプレビュー バージョンは、2025 年 6 月 19 日に安定版を指すようになります。

Gemini 2.5 Flash‑Lite 個のモデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.5-flash-lite-preview-06-17 Gemini 2.5 Flash‑Lite の最初のプレビュー版 プレビュー 2025-06-17 未定

Gemini 2.0 Flash 個のモデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.0-flash-001 Gemini 2.0 Flash の最新の安定版 Stable 2025-02-05
2026 年 2 月 5 日以降
gemini-2.0-flash Gemini 2.0 Flash
最新の安定版(現在は gemini-2.0-flash-001)を指す自動更新エイリアス
Stable 2025-02-10 ---

Gemini 2.0 Flash‑Lite 個のモデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.0-flash-lite-001 Gemini 2.0 Flash‑Lite の最新の安定版 Stable 2025-02-25
2026 年 2 月 25 日以降
gemini-2.0-flash-lite Gemini 2.0 Flash‑Lite
最新の安定版(現在は gemini-2.0-flash-lite-001)を指す自動更新エイリアス
Stable 2025-02-25 ---

Gemini 2.0 Flash Image Generation 個のモデル名

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.0-flash-preview-image-generation 1 Gemini 2.0 Flash Image Generation のプレビュー バージョン プレビュー 2025-05-06 未定

Gemini 2.0 Flash Live 個のモデル名

Vertex AI Gemini API を API プロバイダとして使用している場合にのみ使用できます。

モデル名 説明 リリース ステージ リリース日 廃止日
gemini-2.0-flash-live-preview-04-09 1 Gemini 2.0 Flash Live のプレビュー バージョン プレビュー 2025-04-09 未定

1 Firebase AI Logic SDK で Gemini Developer API を使用する場合はサポートされていません。

Imagen 個のモデル名

プラットフォームの初期化の例については、Imagen を使用して画像を生成するガイドをご覧ください。

リリース ステージ(特にユースケースと課金)の詳細については、モデルのバージョニングと命名パターンをご覧ください。

Imagen 4 個のモデル名

モデル名 説明 リリース ステージ リリース日 廃止日
imagen-4.0-generate-preview-06-06 2 Imagen 4 のプレビュー版 プレビュー 2025-06-06 未定
imagen-4.0-generate-preview-05-20 2 Imagen 4 のプレビュー版 プレビュー 2025-05-20 2025 年 7 月 7 日以降

Imagen 4 Fast 個のモデル名

モデル名 説明 リリース ステージ リリース日 廃止日
imagen-4.0-fast-generate-preview-06-06 2 Imagen 4 Fast のプレビュー版 プレビュー 2025-06-06 未定

Imagen 4 Ultra 個のモデル名

モデル名 説明 リリース ステージ リリース日 廃止日
imagen-4.0-ultra-generate-preview-06-06 2 Imagen 4 Ultra のプレビュー版 プレビュー 2025-06-06 未定
imagen-4.0-ultra-generate-exp-05-20 2 Imagen 4 Ultra の試験運用版 試験運用版 2025-05-20 2025 年 7 月 7 日以降

Imagen 3 個のモデル名

モデル名 説明 リリース ステージ リリース日 廃止日
imagen-3.0-generate-002 Imagen 3 の最新の安定版 Stable 2025-01-23 2026 年 1 月 23 日以降
imagen-3.0-generate-001 2 Imagen 3 の最初の安定版 Stable 2024-07-31 2025 年 7 月 31 日以降

Imagen 3 Fast 個のモデル名

モデル名 説明 リリース ステージ リリース日 廃止日
imagen-3.0-fast-generate-001 2 Imagen 3 Fast の最初の安定版 Stable 2024-07-31 2025 年 7 月 31 日以降

2 API へのアクセス方法に関係なく、Gemini Developer API ではサポートされていません。



サポートされている言語

Gemini

  • すべての Gemini モデルは、次の言語を理解して回答できます。

    アラビア語(ar)、ベンガル語(bn)、ブルガリア語(bg)、中国語(簡体字、繁体字)(zh)、クロアチア語(hr)、チェコ語(cs)、デンマーク語(da)、オランダ語(nl)、英語(en)、エストニア語(et)、フィンランド語(fi)、フランス語(fr)、ドイツ語(de)、ギリシャ語(el)、ヘブライ語(iw)、ヒンディー語(hi)、ハンガリー語(hu)、インドネシア語(id)、イタリア語(it)、日本語(ja)、韓国語(ko)、ラトビア語(lv)、リトアニア語(lt)、ノルウェー語(no)、ポーランド語(pl)、ポルトガル語(pt)、ルーマニア語(ro)、ロシア語(ru)、セルビア語(sr)、スロバキア語(sk)、スロベニア語(sl)、スペイン語(es)、スワヒリ語(sw)、スウェーデン語(sv)、タイ語(th)、トルコ語(tr)、ウクライナ語(uk)、ベトナム語(vi)

  • Gemini 2.0 FlashGemini 1.5 ProGemini 1.5 Flash モデルは、次の追加言語を理解して応答できます。

    アフリカーンス語(af)、アムハラ語(am)、アッサム語(as)、アゼルバイジャン語(az)、ベラルーシ語(be)、ボスニア語(bs)、カタルーニャ語(ca)、セブアノ語(ceb)、コルシカ語(co)、ウェールズ語(cy)、ディベヒ語(dv)、エスペラント語(eo)、バスク語(eu)、ペルシア語(fa)、フィリピン語(タガログ語)(fil)、フリジア語(fy)、アイルランド語(ga)、スコットランド ゲール語(gd)、ガリシア語(gl)、グジャラート語(gu)、ハウサ語(ha)、ハワイ語(haw)、モン語(hmn)、クレオール語(ハイチ)(ht)、アルメニア語(hy)、イボ語(ig)、アイスランド語(is)、ジャワ語(jv)、ジョージア語(ka)、カザフ語(kk)、クメール語(km)、カンナダ語(kn)、クリオ語(kri)、クルド語(ku)、キルギス語(ky)、ラテン語(la)、ルクセンブルク語(lb)、ラオ語(lo)、マダガスカル語(mg)、マオリ語(mi)、マケドニア語(mk)、マラヤーラム語(ml)、モンゴル語(mn)、メイテイ語(マニプル語)(mni-Mtei)、マラーティー語(mr)、マレー語(ms)、マルタ語(mt)、ミャンマー語(ビルマ語)(my)、ネパール語(ne)、ニャンジャ語(チェワ語)(ny)、オディア語(オリヤー語)(or)、パンジャブ語(pa)、パシュトゥ語(ps)、シンド語(sd)、シンハラ語(si)、サモア語(sm)、ショナ語(sn)、ソマリ語(so)、アルバニア語(sq)、ソト語(st)、スンダ語(su)、タミル語(ta)、テルグ語(te)、タジク語(tg)、ウイグル語(ug)、ウルドゥー語(ur)、ウズベク語(uz)、コーサ語(xh)、イディッシュ語(yi)、ヨルバ語(yo)、ズールー語(zu)

Imagen

  • 一般提供: 英語

  • プレビュー: 中国語(簡体)、中国語(繁体)、ヒンディー語、日本語、韓国語、ポルトガル語、スペイン語



以前のモデルに関する情報

Firebase AI Logic は、以前のアクティブな Gemini モデル(Gemini 1.5 モデルなど)をサポートしています。

Firebase AI Logic は、以前の Imagen モデル(Imagen 2 など)をサポートしていません。

モデル 入力 出力 適した用途
Gemini 1.5 Pro
gemini-1.5-pro-002
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON より高度なインテリジェンスを必要とする複雑な推論タスクをサポートします。200 万トークンの長いコンテキスト
Gemini 1.5 Flash
gemini-1.5-flash-002
テキスト、コード、PDF、画像、動画、音声 テキスト、コード、JSON さまざまなタスクで高速かつ汎用性の高いパフォーマンスを実現
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
テキスト、コード、PDF、画像、動画(フレームのみ) テキスト、コード テキストまたはコード レスポンスのテキスト、画像、動画を処理します。チャットには使用できません。
Gemini 1.0 Pro
gemini-1.0-pro-002
テキスト、コード テキスト、コード 自然言語タスク、マルチターン テキストとコードチャット、コード生成



次のステップ

Gemini API の機能を試す