モバイルアプリとウェブアプリの場合、Firebase AI Logic SDK を使用すると、サポートされている Gemini モデルと Imagen モデルをアプリから直接操作できます。
Gemini モデルは、テキスト、コード、PDF、画像、動画、音声など、複数のモダリティを処理し、生成することもできるため、マルチモーダルと見なされます。Imagen モデルは、テキストでプロンプトして画像を生成できます。
次の表は、Firebase AI Logic でサポートされているモデルと、その最新の安定版モデル名の簡単な概要です。この表には、ユースケースのプロトタイピングに使用できるプレビュー版と試験運用版のモデルも記載されています。
また、Firebase AI Logic がサポートしているモデルとサポートしていないモデルに関するよくある質問もご確認ください。
Gemini 個のモデル
モデル | 入力 | 出力 | 説明 |
---|---|---|---|
安定版の Gemini モデル | |||
Gemini 2.5 Progemini-2.5-pro
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | 複雑な問題を解決できる、Google の最先端の推論モデル。 |
Gemini 2.5 Flashgemini-2.5-flash
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | 優れた多機能性を備えた Google の思考モデル。価格とパフォーマンスのバランスが取れるように設計されています。 |
Gemini 2.0 Flashgemini-2.0-flash-001
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | 優れたスピード、組み込みツールの使用、100 万トークンのコンテキスト ウィンドウなど、次世代の機能と改善された機能を備えたマルチモーダル モデル |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | 最も高速で費用対効果の高い Flash モデル。価格と速度はそのままに品質の向上を求めている 1.5 Flash ユーザー向けのアップグレード パスです。 |
プレビュー版と試験運用版のみの Gemini モデル (プロトタイピングのユースケースにのみ推奨) | |||
Gemini 2.5 Flash‑Litegemini-2.5-flash-lite-preview-06-17
|
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | 低レイテンシのユースケース向けに最適化された、最もバランスの取れた Gemini モデル。 |
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation
|
テキスト、コード、PDF、画像、動画、音声 | 画像、テキスト、画像 | マルチモーダル入力と画像出力をサポートするマルチモーダル モデル。 |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09
|
テキスト(ストリーミング)、 音声(ストリーミング) |
テキスト(ストリーミング)、 音声(ストリーミング) |
マルチモーダル入力と出力の低レイテンシのリアルタイム ストリーミングをサポートするマルチモーダル モデル。 |
1 Firebase AI Logic SDK で Gemini Developer API を使用する場合はサポートされていません。
Imagen 個のモデル
モデル | 入力 | 出力 | 説明 |
---|---|---|---|
安定版の Imagen モデル | |||
Imagen 3imagen-3.0-generate-002 |
テキスト | 画像 | 自然言語テキスト プロンプトからリアルで高品質な画像を生成します |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
テキスト | 画像 | プロトタイピングや低レイテンシのユースケース用の画像を生成します。 |
プレビュー版と試験運用版のみの Imagen モデル (プロトタイピングのユースケースにのみ推奨) | |||
Imagen 4 2imagen-4.0-generate-preview-06-06
|
テキスト | 画像 | 自然言語テキスト プロンプトからリアルで高品質な画像を生成します |
Imagen 4 Fast 2imagen-4.0-fast-generate-preview-06-06
|
テキスト | 画像 | プロトタイピングや低レイテンシのユースケース用の画像を生成します。 |
Imagen 4 Ultra 2imagen-4.0-ultra-generate-preview-06-06
|
テキスト | 画像 | 自然言語テキスト プロンプトからリアルで高品質な画像を生成します |
2 この Imagen モデルは、API へのアクセス方法に関係なく、Gemini Developer API でサポートされていません。
このページの残りの部分では、Firebase AI Logic でサポートされているモデルについて詳しく説明します。
-
- サポートされている入出力
- サポートされている機能の概要の比較
- 仕様と制限事項(最大入力トークン数や入力動画の最大長など)
モデルのバージョン管理方法(特に、安定版、自動更新版、プレビュー版、試験運用版)の説明
初期化時にコードに含める使用可能なモデル名のリスト
モデルのサポートされている言語のリスト
このページの下部で、以前のモデルの詳細情報を確認できます。
モデルの比較
各モデルには、さまざまなユースケースに対応するための異なる機能があります。このセクションの各表では、Firebase AI Logic とともに使用した場合の各モデルについて説明します。各モデルには、SDK を使用する際には利用できない追加機能がある場合があります。
次のサブセクションで必要な情報が見つからない場合は、選択した API プロバイダのドキュメントで詳細を確認してください。
Gemini Developer API: Gemini モデルと Imagen モデル
Vertex AI Gemini API: Gemini モデルと Imagen モデル
サポートされている入出力
Firebase AI Logic で各モデルを使用する場合、サポートされている入出力の型は次のとおりです。
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash 画像生成 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | ||
---|---|---|---|---|---|---|---|---|---|
入力値の型 | |||||||||
テキスト | |||||||||
テキスト(ストリーミング) | |||||||||
コード | |||||||||
ドキュメント (PDF またはプレーン テキスト) |
|||||||||
画像 | |||||||||
動画 | |||||||||
音声 | |||||||||
音声(ストリーミング) | |||||||||
出力タイプ | |||||||||
テキスト | |||||||||
テキスト(ストリーミング) | |||||||||
コード | |||||||||
構造化された出力 (JSON など) |
|||||||||
画像 | |||||||||
音声 | |||||||||
音声(ストリーミング) |
サポートされているファイル形式については、サポートされている入力ファイルと要件をご覧ください。
サポートされている機能
Firebase AI Logic で各モデルを使用する場合にサポートされる機能は次のとおりです。
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash 画像生成 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | |
---|---|---|---|---|---|---|---|---|
テキストのみの入力またはマルチモーダル入力からテキストを生成する | インターリーブまたは画像の一部として | ストリーミングのみ | ||||||
画像を生成する (Gemini または Imagen) |
||||||||
音声を生成する | ストリーミングのみ | |||||||
構造化出力
(JSON など)を生成する |
||||||||
ドキュメントを分析する
(PDF またはプレーン テキスト) |
||||||||
画像を分析する (vision) | ||||||||
動画を分析する(ビジョン) | ||||||||
音声を分析する | ストリーミングのみ | |||||||
マルチターン チャット | ||||||||
関数呼び出し(ツール) | ||||||||
トークンをカウントする | ||||||||
システム指示 | ||||||||
双方向マルチモーダル ストリーミング |
仕様と制限事項
Firebase AI Logic で各モデルを使用する場合の仕様と制限事項は次のとおりです。
プロパティ |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash 画像生成 </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen |
---|---|---|---|---|---|---|---|---|
コンテキスト ウィンドウ * トークンの合計上限 (入力と出力の合計) |
1,048,576 個のトークン | 1,048,576 個のトークン | 1,048,576 個のトークン | 1,048,576 個のトークン | 1,048,576 個のトークン | 32,768 個のトークン | 32,768 個のトークン | 480 トークン |
出力トークンの上限 * | 65,536 個のトークン | 65,536 個のトークン | 65,536 個のトークン | 8,192 個のトークン | 8,192 個のトークン | 8,192 個のトークン | 8,192 個のトークン | --- |
ナレッジ カットオフ日 | 2025 年 1 月 | 2025 年 1 月 | 2025 年 1 月 | 2024 年 6 月 | 2024 年 6 月 | 2024 年 8 月 | 2024 年 8 月 | --- |
PDF(リクエストごと) | ||||||||
入力 PDF ファイルの最大数 ** |
3,000 ファイル | 3,000 ファイル | 3,000 ファイル | 3,000 ファイル | 3,000 ファイル | 3,000 ファイル | --- | --- |
入力 PDF ファイルあたりの最大ページ数 ** |
1,000 ページ | 1,000 ページ | 1,000 ページ | 1,000 ページ | 1,000 ページ | 1,000 ページ | --- | --- |
入力 PDF ファイルあたりの最大サイズ |
50 MB | 50 MB | 50 MB | 50 MB | 50 MB | 50 MB | --- | --- |
画像(リクエストあたり) | ||||||||
入力画像の最大数 |
3,000 個の画像 | 3,000 個の画像 | 3,000 個の画像 | 3,000 個の画像 | 3,000 個の画像 | 3,000 個の画像 | --- | --- |
出力画像の最大数 |
--- | --- | --- | --- | --- | 10 枚の画像 | --- | 4 枚 |
入力された base64 エンコード画像の最大サイズ |
7 MB | 7 MB | 7 MB | 7 MB | 7 MB | 7 MB | --- | --- |
動画(リクエストごと) | ||||||||
入力動画ファイルの最大数 |
10 個のファイル | 10 個のファイル | 10 個のファイル | 10 個のファイル | 10 個のファイル | 10 個のファイル | --- | --- |
すべての入力動画の最大長 (フレームのみ) |
~ 60 分 | ~ 60 分 | ~ 60 分 | ~ 60 分 | ~ 60 分 | ~ 60 分 | --- | --- |
すべての入力動画 (フレーム + 音声)の最大長 |
45 分程度 | 45 分程度 | 45 分程度 | 45 分程度 | 45 分程度 | 45 分程度 | --- | --- |
音声(リクエストごと) | ||||||||
入力音声ファイルの最大数 |
1 個のファイル | 1 個のファイル | 1 個のファイル | 1 個のファイル | 1 個のファイル | 1 個のファイル | --- | --- |
出力音声ファイルの最大数 |
--- | --- | --- | --- | --- | --- | --- | --- |
すべての入力音声の最大長 |
~ 8.4 時間 | ~ 8.4 時間 | ~ 8.4 時間 | ~ 8.4 時間 | ~ 8.4 時間 | ~ 8.4 時間 | --- | --- |
すべての出力音声の最大長 |
--- | --- | --- | --- | --- | --- | --- | --- |
*
すべての Gemini モデルでは、1 個のトークンは約 4 文字に相当するため、100 個のトークンは約 60 ~ 80 ワード(英語)です。Gemini モデルの場合、countTokens
を使用して、リクエスト内のトークンの合計数を特定できます。
** PDF は画像として扱われるため、PDF の 1 ページは 1 つの画像として扱われます。リクエストで許可されるページ数は、モデルがサポートできる画像の数に制限されます。
詳細情報を確認する
サポートされている入力ファイル形式、MIME タイプの指定方法、入力ファイルとマルチモーダル リクエストが サポートされている入力ファイルと要件の要件を満たし、ベスト プラクティスに沿っていることを確認する方法について学習する。
モデルのバージョニングと命名パターン
モデルは、安定版、プレビュー版、試験運用版で提供されます。便宜上、明示的なバージョン値のないエイリアスがサポートされています。
コードで使用する特定のモデル名については、このページの後半の「使用可能なモデル名」セクションをご覧ください。
バージョンの種類 / リリース ステージ |
説明 | モデル名のパターン | |
---|---|---|---|
Stable |
安定版は、リリース日から本番環境での使用が可能になり、サポートされます。 通常、安定版のモデル バージョンは、モデルが利用可能な最終日を示す廃止日とともにリリースされます。この日を過ぎると、モデルにアクセスできなくなり、Google のサポートも受けられなくなります。 |
|
|
自動更新された安定版エイリアス (Gemini 2.0 モデルのみ) |
自動更新安定版エイリアスは、常にそのモデルの最新の安定版を指します。新しい安定版がリリースされると、自動更新エイリアスは自動的にその新しい安定版を指すようになります。 |
Gemini 2.0 モデルのみ
例: |
|
プレビュー |
プレビュー版には新しい機能が搭載されていますが、安定版ではないと見なされます。 これらのモデルは本番環境での使用には推奨されません。レート上限が厳しく、課金要件が適用される場合があります。
Vertex AI Gemini API の場合、2025 年 6 月以降にリリースされたプレビュー モデルでは、通常、モデルのロケーションを |
プレビュー バージョンのモデル名には、モデルのリリース日(
例: |
|
試験運用版 |
試験運用バージョンには新しい機能が搭載されており、安定していないと見なされます。 これらのモデルは本番環境での使用には推奨されず、より厳しいレート制限が適用されます。試験運用版モデルは、フィードバックを収集し、最新機能のテストを可能にすることを目的としています。 Vertex AI Gemini API の場合、2025 年 6 月以降にリリースされた試験運用モデルでは、モデルのロケーションを |
試験運用版のモデル名には、モデルのリリース日(
例: |
|
Retired |
廃止されたバージョンは、廃止日を過ぎており、完全に無効になっています。 廃止されたモデルは、Google からアクセスすることもサポートを受けることもできません。通常、廃止されたモデル ID を参照するリクエストは 404 エラーを返します。 |
--- |
使用可能なモデル名
モデル名は、モデルの初期化時にコードに含める明示的な値です。
使用可能なすべてのモデルをプログラムで一覧表示する
REST API を使用して、使用可能なすべてのモデル名を一覧表示できます。
Gemini Developer API:
models.list
エンドポイントを呼び出します。Vertex AI Gemini API:
publishers.models.list
エンドポイントを呼び出します。
返されるリストには、API プロバイダがサポートするすべてのモデルが含まれますが、Firebase AI Logic はこのページで説明する Gemini モデルと Imagen モデルのみをサポートします。また、自動更新エイリアス(gemini-2.0-flash
など)は基本モデルの便利なエイリアスであるため、一覧表示されません。
Gemini 個のモデル名
プラットフォームの初期化の例については、スタートガイドをご覧ください。
リリース ステージ(特にユースケースと課金)の詳細については、モデルのバージョニングと命名パターンをご覧ください。
Gemini 2.5 Pro 個のモデル名
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
gemini-2.5-pro |
Gemini 2.5 Pro の最新の安定版 | Stable | 2025-06-17 | 2026 年 6 月 17 日以降 |
gemini-2.5-pro-preview-06-05 |
Gemini 2.5 Pro の最新の安定版(現在は gemini-2.5-pro |
プレビュー | 2025-06-05 | 2025 年 7 月 15 日以降 |
gemini-2.5-pro-preview-05-06 |
Gemini 2.5 Pro* の最新の安定版を指すプレビュー版(現在は gemini-2.5-pro |
プレビュー | 2025-05-06 | 2025 年 7 月 15 日以降 |
gemini-2.5-pro-preview-03-25 |
Gemini 2.5 Pro* の最新の安定版を指すプレビュー版(現在は gemini-2.5-pro |
プレビュー | 2025 年 3 月 25 日 | 2025 年 7 月 15 日以降 |
* Gemini 2.5 Pro モデルの既存のプレビュー バージョンは、2025 年 6 月 19 日に安定版を指すようになります。
Gemini 2.5 Flash 個のモデル名
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
gemini-2.5-flash |
Gemini 2.5 Flash の最新の安定版 | Stable | 2025-06-17 | 2026 年 6 月 17 日以降 |
gemini-2.5-flash-preview-05-20 |
Gemini 2.5 Flash の最新の安定版(現在は gemini-2.5-flash |
プレビュー | 2025-05-20 | 2025 年 7 月 15 日以降 |
gemini-2.5-flash-preview-04-17 |
Gemini 2.5 Flash* の最新の安定版を指すプレビュー版(現在は gemini-2.5-flash |
プレビュー | 2025-04-17 | 2025 年 7 月 15 日以降 |
* Gemini 2.5 Flash モデルの既存のプレビュー バージョンは、2025 年 6 月 19 日に安定版を指すようになります。
Gemini 2.5 Flash‑Lite 個のモデル名
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
gemini-2.5-flash-lite-preview-06-17 |
Gemini 2.5 Flash‑Lite の最初のプレビュー版 | プレビュー | 2025-06-17 | 未定 |
Gemini 2.0 Flash 個のモデル名
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
gemini-2.0-flash-001 |
Gemini 2.0 Flash の最新の安定版 | Stable | 2025-02-05 | 2026 年 2 月 5 日以降 |
gemini-2.0-flash |
Gemini 2.0 Flash の最新の安定版(現在は gemini-2.0-flash-001 |
Stable | 2025-02-10 | --- |
Gemini 2.0 Flash‑Lite 個のモデル名
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Gemini 2.0 Flash‑Lite の最新の安定版 | Stable | 2025-02-25 | 2026 年 2 月 25 日以降 |
gemini-2.0-flash-lite |
Gemini 2.0 Flash‑Lite の最新の安定版(現在は gemini-2.0-flash-lite-001 |
Stable | 2025-02-25 | --- |
Gemini 2.0 Flash Image Generation 個のモデル名
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation 1 |
Gemini 2.0 Flash Image Generation のプレビュー バージョン | プレビュー | 2025-05-06 | 未定 |
Gemini 2.0 Flash Live 個のモデル名
Vertex AI Gemini API を API プロバイダとして使用している場合にのみ使用できます。 |
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Gemini 2.0 Flash Live のプレビュー バージョン | プレビュー | 2025-04-09 | 未定 |
1 Firebase AI Logic SDK で Gemini Developer API を使用する場合はサポートされていません。
Imagen 個のモデル名
プラットフォームの初期化の例については、Imagen を使用して画像を生成するガイドをご覧ください。
リリース ステージ(特にユースケースと課金)の詳細については、モデルのバージョニングと命名パターンをご覧ください。
Imagen 4 個のモデル名
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
imagen-4.0-generate-preview-06-06 2 |
Imagen 4 のプレビュー版 | プレビュー | 2025-06-06 | 未定 |
imagen-4.0-generate-preview-05-20 2 |
Imagen 4 のプレビュー版 | プレビュー | 2025-05-20 | 2025 年 7 月 7 日以降 |
Imagen 4 Fast 個のモデル名
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
imagen-4.0-fast-generate-preview-06-06 2 |
Imagen 4 Fast のプレビュー版 | プレビュー | 2025-06-06 | 未定 |
Imagen 4 Ultra 個のモデル名
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
imagen-4.0-ultra-generate-preview-06-06 2 |
Imagen 4 Ultra のプレビュー版 | プレビュー | 2025-06-06 | 未定 |
imagen-4.0-ultra-generate-exp-05-20 2 |
Imagen 4 Ultra の試験運用版 | 試験運用版 | 2025-05-20 | 2025 年 7 月 7 日以降 |
Imagen 3 個のモデル名
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
imagen-3.0-generate-002 |
Imagen 3 の最新の安定版 | Stable | 2025-01-23 | 2026 年 1 月 23 日以降 |
imagen-3.0-generate-001 2 |
Imagen 3 の最初の安定版 | Stable | 2024-07-31 | 2025 年 7 月 31 日以降 |
Imagen 3 Fast 個のモデル名
モデル名 | 説明 | リリース ステージ | リリース日 | 廃止日 |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Imagen 3 Fast の最初の安定版 | Stable | 2024-07-31 | 2025 年 7 月 31 日以降 |
2 API へのアクセス方法に関係なく、Gemini Developer API ではサポートされていません。
サポートされている言語
Gemini
すべての Gemini モデルは、次の言語を理解して回答できます。
アラビア語(ar)、ベンガル語(bn)、ブルガリア語(bg)、中国語(簡体字、繁体字)(zh)、クロアチア語(hr)、チェコ語(cs)、デンマーク語(da)、オランダ語(nl)、英語(en)、エストニア語(et)、フィンランド語(fi)、フランス語(fr)、ドイツ語(de)、ギリシャ語(el)、ヘブライ語(iw)、ヒンディー語(hi)、ハンガリー語(hu)、インドネシア語(id)、イタリア語(it)、日本語(ja)、韓国語(ko)、ラトビア語(lv)、リトアニア語(lt)、ノルウェー語(no)、ポーランド語(pl)、ポルトガル語(pt)、ルーマニア語(ro)、ロシア語(ru)、セルビア語(sr)、スロバキア語(sk)、スロベニア語(sl)、スペイン語(es)、スワヒリ語(sw)、スウェーデン語(sv)、タイ語(th)、トルコ語(tr)、ウクライナ語(uk)、ベトナム語(vi)
Gemini 2.0 Flash、Gemini 1.5 Pro、Gemini 1.5 Flash モデルは、次の追加言語を理解して応答できます。
アフリカーンス語(af)、アムハラ語(am)、アッサム語(as)、アゼルバイジャン語(az)、ベラルーシ語(be)、ボスニア語(bs)、カタルーニャ語(ca)、セブアノ語(ceb)、コルシカ語(co)、ウェールズ語(cy)、ディベヒ語(dv)、エスペラント語(eo)、バスク語(eu)、ペルシア語(fa)、フィリピン語(タガログ語)(fil)、フリジア語(fy)、アイルランド語(ga)、スコットランド ゲール語(gd)、ガリシア語(gl)、グジャラート語(gu)、ハウサ語(ha)、ハワイ語(haw)、モン語(hmn)、クレオール語(ハイチ)(ht)、アルメニア語(hy)、イボ語(ig)、アイスランド語(is)、ジャワ語(jv)、ジョージア語(ka)、カザフ語(kk)、クメール語(km)、カンナダ語(kn)、クリオ語(kri)、クルド語(ku)、キルギス語(ky)、ラテン語(la)、ルクセンブルク語(lb)、ラオ語(lo)、マダガスカル語(mg)、マオリ語(mi)、マケドニア語(mk)、マラヤーラム語(ml)、モンゴル語(mn)、メイテイ語(マニプル語)(mni-Mtei)、マラーティー語(mr)、マレー語(ms)、マルタ語(mt)、ミャンマー語(ビルマ語)(my)、ネパール語(ne)、ニャンジャ語(チェワ語)(ny)、オディア語(オリヤー語)(or)、パンジャブ語(pa)、パシュトゥ語(ps)、シンド語(sd)、シンハラ語(si)、サモア語(sm)、ショナ語(sn)、ソマリ語(so)、アルバニア語(sq)、ソト語(st)、スンダ語(su)、タミル語(ta)、テルグ語(te)、タジク語(tg)、ウイグル語(ug)、ウルドゥー語(ur)、ウズベク語(uz)、コーサ語(xh)、イディッシュ語(yi)、ヨルバ語(yo)、ズールー語(zu)
Imagen
一般提供: 英語
プレビュー: 中国語(簡体)、中国語(繁体)、ヒンディー語、日本語、韓国語、ポルトガル語、スペイン語
以前のモデルに関する情報
Firebase AI Logic は、以前のアクティブな Gemini モデル(Gemini 1.5 モデルなど)をサポートしています。
Firebase AI Logic は、以前の Imagen モデル(Imagen 2 など)をサポートしていません。
モデル | 入力 | 出力 | 適した用途 |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | より高度なインテリジェンスを必要とする複雑な推論タスクをサポートします。200 万トークンの長いコンテキスト |
Gemini 1.5 Flashgemini-1.5-flash-002 |
テキスト、コード、PDF、画像、動画、音声 | テキスト、コード、JSON | さまざまなタスクで高速かつ汎用性の高いパフォーマンスを実現 |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
次のステップ
Gemini API の機能を試す
- マルチターン会話(チャット)を構築します。
- テキストのみのプロンプトからテキストを生成します。
- 画像、PDF、動画、音声などのさまざまなファイル形式でプロンプトを入力して、テキストを生成します。
- テキスト プロンプトとマルチモーダル プロンプトの両方から構造化出力(JSON など)を生成します。
- テキスト プロンプトから画像を生成します(Gemini または Imagen)。
- Gemini Live API を使用したストリームの入出力(音声を含む)。
- 関数呼び出しを使用して、生成モデルを外部システムや情報に接続します。