Узнайте о поддерживаемых моделях

Для мобильных и веб-приложений пакеты Firebase AI Logic SDK позволяют взаимодействовать с поддерживаемыми моделями Gemini и моделями Imagen 3 непосредственно из вашего приложения.

Модели Gemini считаются мультимодальными , поскольку они способны обрабатывать и даже генерировать несколько модальностей, включая текст, код, PDF-файлы, изображения, видео и аудио. Модели Imagen 3 могут получать подсказки с текстом для генерации изображений.

Следующая таблица представляет собой краткий обзор поддерживаемых моделей для Firebase AI Logic и их последних стабильных названий моделей. В этой таблице также перечислены предварительные и экспериментальные модели, доступные для вариантов использования прототипирования.

Модель Вход Выход Описание
Модели Gemini со стабильными версиями
Близнецы 2.0 Флэш
gemini-2.0-flash-001
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON
(изображения и аудио скоро появятся!)
Наша мультимодальная модель с функциями следующего поколения и улучшенными возможностями, включая превосходную скорость, встроенные инструменты и контекстное окно токенов размером 1 млн (мультимодальная генерация скоро!)
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON Наша самая быстрая и экономически эффективная модель Flash. Это путь обновления для пользователей 1.5 Flash, которые хотят лучшего качества за ту же цену и скорость.
Модели Gemini , имеющие только предварительные и экспериментальные версии (рекомендуется только для прототипирования)
Близнецы 2.5 Про
gemini-2.5-pro-preview-05-06
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON Наша самая передовая модель рассуждений, способная решать сложные задачи.
Близнецы 2.5 Флэш
gemini-2.5-flash-preview-04-17
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON Наша модель мышления, которая предлагает великолепные, всесторонние возможности. Она разработана для обеспечения баланса между ценой и производительностью.
Gemini 2.0 Flash‑Live 1
gemini-2.0-flash-live-preview-04-09
текст (потоковый),
аудио (потоковое)
текст (потоковый),
аудио (потоковое)
Наша мультимодальная модель поддерживает потоковую передачу мультимодальных входов и выходов в реальном времени с малой задержкой.
Модели Imagen 3 (при использовании с Firebase AI Logic )
Изображение 3
imagen-3.0-generate-002
текст изображения Создает реалистичные, высококачественные изображения из текстовых подсказок на естественном языке.
Имидж 3 Фаст 2
imagen-3.0-fast-generate-001
текст изображения Генерирует изображения для создания прототипов или вариантов использования с малой задержкой

1 Не поддерживается при использовании Gemini Developer API с Firebase AI Logic SDK.
2 Не поддерживается API разработчика Gemini независимо от способа доступа к API.

Также ознакомьтесь с нашими часто задаваемыми вопросами обо всех моделях, которые Firebase AI Logic поддерживает и не поддерживает.


Оставшаяся часть этой страницы содержит подробную информацию о моделях, поддерживаемых Firebase AI Logic .

  • Сравнение моделей :

    • Поддерживаемый ввод и вывод
    • Высокоуровневое сравнение поддерживаемых возможностей
    • Характеристики и ограничения, например, максимальное количество входных токенов или максимальная длина входного видео.
  • Описание того , как версионируются модели , в частности их стабильные , автоматически обновляемые , предварительные и экспериментальные версии.

  • Списки доступных названий моделей для включения в код во время инициализации

  • Списки поддерживаемых языков для моделей

Внизу этой страницы вы можете просмотреть подробную информацию о старых моделях .



Сравнить модели

Каждая модель имеет различные возможности для поддержки различных вариантов использования. Обратите внимание, что каждая из таблиц в этом разделе описывает каждую модель при использовании с Firebase AI Logic . Каждая модель может иметь дополнительные возможности, которые недоступны при использовании наших SDK.

Если вы не нашли нужную информацию в следующих подразделах, вы можете найти еще больше информации в документации выбранного вами поставщика API:

Поддерживаемый ввод и вывод

Ниже приведены поддерживаемые типы входных и выходных данных при использовании каждой модели с Firebase AI Logic :

Близнецы
2.5 Про
Близнецы
2.5 Вспышка
Близнецы
2.0 Флэш
Близнецы
2.0 Flash-
Лайт
Близнецы
2.0 Flash-
Жить
Изображение 3 /
Imagen 3 Быстрый
Типы входных данных
Текст
Текст (потоковый)
Код
Документы
(PDF-файлы или обычный текст)
Изображения
Видео
Аудио
Аудио (потоковое)
Типы выходных данных
Текст
Текст (потоковый)
Код
Структурированный вывод
(например, JSON)
Изображения вскоре!
Аудио вскоре!
Аудио (потоковое)

Информацию о поддерживаемых типах файлов см. в разделе Поддерживаемые входные файлы и требования .

Поддерживаемые возможности и функции

Ниже приведены поддерживаемые возможности и функции при использовании каждой модели с Firebase AI Logic :

Близнецы
2.5 Про
Близнецы
2.5 Вспышка
Близнецы
2.0 Флэш
Близнецы
2.0 Flash-
Лайт
Близнецы
2.0 Flash-
Жить
Изображение 3 /
Imagen 3 Быстрый
Генерация текста из текстовых или мультимодальных входных данных только потоковая передача
Генерировать изображения
( Изображение 3 )
вскоре!
Сгенерировать аудио вскоре! только потоковая передача
Генерация структурированного вывода
(например, JSON)
Анализировать документы
(PDF-файлы или обычный текст)
Анализ изображений (зрение)
Анализ видео (видение)
Анализировать аудио только потоковая передача
Многооборотный чат
Вызов функций (инструменты)
Подсчет жетонов
Системные инструкции
Двунаправленная мультимодальная потоковая передача

Характеристики и ограничения

Ниже приведены характеристики и ограничения при использовании каждой модели с Firebase AI Logic :

Свойство Близнецы
2.5 Про
Близнецы
2.5 Вспышка
Близнецы
2.0 Флэш
Близнецы
2.0 Flash-
Лайт
Близнецы
2.0 Flash-
Жить
Изображение 3 /
Imagen 3 Быстрый
Контекстное окно *
Общий лимит токенов
(комбинированный вход+выход)
1,048,576 токенов 1,048,576 токенов 1,048,576 токенов 1,048,576 токенов 32,768 токенов 480 токенов
Лимит выходных токенов * 65 536 токенов 65 536 токенов 8,192 жетона 8,192 жетона --- ---
Крайний срок подачи знаний Январь 2025 г. Январь 2025 г. Июнь 2024 г. Июнь 2024 г. Август 2024 г. ---
PDF-файлы (по запросу)
Максимальное количество
входных PDF-файлов **
3000 файлов 3000 файлов 3000 файлов 3000 файлов --- ---
Максимальное количество
страниц
за входной PDF-файл **
1000 страниц 1000 страниц 1000 страниц 1000 страниц --- ---
Максимальный размер
на каждый входной PDF-файл
50 МБ 50 МБ 50 МБ 50 МБ --- ---
Изображения (по запросу)
Максимальное количество
входных изображений
3000 изображений 3000 изображений 3000 изображений 3000 изображений --- ---
Максимальное количество
выходных изображений
--- --- вскоре! --- --- 4 изображения
Максимальный размер
на входное изображение в кодировке base64
7 МБ 7 МБ 7 МБ 7 МБ --- ---
Видео (по запросу)
Максимальное количество
входных видеофайлов
10 файлов 10 файлов 10 файлов 10 файлов --- ---
Макс. длина
всех входных видео
(только кадры)
~60 минут ~60 минут ~60 минут ~60 минут --- ---
Макс. длина
всех входных видео
(кадры+аудио)
~45 минут ~45 минут ~45 минут ~45 минут --- ---
Аудио (по запросу)
Максимальное количество
входных аудиофайлов
1 файл 1 файл 1 файл 1 файл --- ---
Максимальное количество
выходных аудиофайлов
--- --- вскоре! --- --- ---
Макс. длина
всех входных аудиосигналов
~8,4 часа ~8,4 часа ~8,4 часа ~8,4 часа --- ---
Макс. длина
всех выходных аудиосигналов
--- --- вскоре! --- --- ---

* Для всех моделей Gemini токен эквивалентен примерно 4 символам, поэтому 100 токенов — это около 60-80 английских слов. Для моделей Gemini вы можете определить общее количество токенов в ваших запросах с помощью countTokens .

** PDF-файлы обрабатываются как изображения, поэтому одна страница PDF-файла обрабатывается как одно изображение. Количество страниц, разрешенных в запросе, ограничено количеством изображений, которые может поддерживать модель.

Найти дополнительную подробную информацию



Модели управления версиями и именования

Модели предлагаются в стабильной , предварительной и экспериментальной версиях. Для удобства поддерживаются псевдонимы без явных значений версии.

Чтобы найти конкретные названия моделей для использования в вашем коде, см. раздел «Доступные названия моделей» далее на этой странице.

Тип версии /
Стадия релиза
Описание Название модели шаблон
Стабильный Стабильные версии доступны и поддерживаются для использования в производственных целях, начиная с даты выпуска.

Стабильная версия модели обычно выпускается с датой выхода из эксплуатации, которая указывает последний день, когда модель доступна. После этой даты модель больше не доступна и не поддерживается Google.

Названия моделей стабильных версий дополнены определенным трехзначным номером версии.

Пример: gemini-2.0-flash-001
Пример:
imagen-3.0-generate-002

Автоматически обновляемый стабильный псевдоним Автоматически обновляемые стабильные псевдонимы всегда указывают на последнюю стабильную версию этой модели. Если выпускается новая стабильная версия, автоматически обновляемый псевдоним автоматически начинает указывать на эту новую стабильную версию.

Названия моделей псевдонимов не имеют придатков.

Пример: gemini-2.0-flash

Предварительный просмотр Предварительные версии обладают новыми возможностями и считаются нестабильными .

Предварительные версии всегда указывают на последнюю предварительную версию этой модели. Если выпущена новая предварительная версия, любая существующая предварительная версия автоматически начинает указывать на эту новую предварительную версию.

Эти модели не рекомендуются для использования в производственных целях, имеют более строгие ограничения по скорости и могут иметь требования к выставлению счетов.

Названия моделей предварительных версий дополнены -preview вместе с датой выпуска модели ( -MM-DD )

Пример: gemini-2.5-flash-preview-04-17
(выпущено 17 апреля 2025 г.)

Экспериментальный Экспериментальные версии обладают новыми возможностями и считаются нестабильными .

Эти модели не рекомендуются для использования в производстве и имеют более строгие ограничения скорости. Экспериментальные модели предназначены для сбора отзывов и для экспериментов с нашими новейшими функциями.

Названия моделей экспериментальных версий дополнены -exp вместе с датой выпуска модели ( -MM-DD )

Пример: gemini-2.5-pro-exp-03-25
(выпущено 25 марта 2025 г.)

Ушедший на пенсию Устаревшие версии уже вышли из эксплуатации и были окончательно деактивированы.

Устаревшие модели больше не доступны и не поддерживаются Google. Запросы, ссылающиеся на идентификатор устаревшей модели, обычно возвращают ошибку 404.

---



Доступные названия моделей

Имена моделей — это явные значения, которые вы включаете в код во время инициализации модели.

Программный список всех доступных моделей

Вы можете получить список всех доступных названий моделей с помощью REST API:

Обратите внимание, что этот возвращаемый список будет включать все модели, поддерживаемые поставщиками API, но Firebase AI Logic поддерживает только модели Gemini и Imagen , описанные на этой странице. Также обратите внимание, что автоматически обновляемые псевдонимы (например, gemini-2.0-flash ) не перечислены, поскольку они являются удобным псевдонимом для базовой модели.

Названия моделей Gemini

Примеры инициализации для вашей платформы см. в руководстве по началу работы .

Подробную информацию об этапах выпуска (особенно в части вариантов использования и выставления счетов) см. в разделе «Шаблоны управления версиями и именования моделей» .

Названия моделей Gemini 2.5 Pro

Название модели Описание Стадия релиза Дата выпуска Дата выхода на пенсию
gemini-2.5-pro-preview-05-06 Предварительная версия Gemini 2.5 Pro Предварительный просмотр 2025-05-06 Будет определено
gemini-2.5-pro-preview-03-25 Предварительная версия, указывающая на gemini-2.5-pro-preview-05-06
(это последняя предварительная версия)
Предварительный просмотр 2025-03-25 Будет определено

Названия моделей Gemini 2.5 Flash

Название модели Описание Стадия релиза Дата выпуска Дата выхода на пенсию
gemini-2.5-flash-preview-04-17 Предварительная версия Gemini 2.5 Flash Предварительный просмотр 2025-04-17 Будет определено

Названия моделей Gemini 2.0 Flash

Название модели Описание Стадия релиза Дата выпуска Дата выхода на пенсию
gemini-2.0-flash-001 Последняя стабильная версия Gemini 2.0 Flash Стабильный 2025-02-05 Не ранее, чем
2026-02-05
gemini-2.0-flash Автоматически обновленный псевдоним, указывающий на последнюю стабильную версию 2.0 Flash
(в настоящее время gemini-2.0-flash-001 )
Стабильный 2025-02-10 ---

Названия моделей Gemini 2.0 Flash‑Lite

Название модели Описание Стадия релиза Дата выпуска Дата выхода на пенсию
gemini-2.0-flash-lite-001 Последняя стабильная версия Gemini 2.0 Flash‑Lite Стабильный 2025-02-25 Не ранее, чем
2026-02-25
gemini-2.0-flash-lite Автоматически обновленный псевдоним, указывающий на последнюю стабильную версию 2.0 Flash-Lite
(в настоящее время gemini-2.0-flash-lite-001 )
Стабильный 2025-02-25 ---

Названия моделей Gemini 2.0 Flash‑Live

Доступно только при использовании API Vertex AI Gemini в качестве поставщика API.

Название модели Описание Стадия релиза Дата выпуска Дата выхода на пенсию
gemini-2.0-flash-live-preview-04-09 1 Предварительная версия для Gemini 2.0 Flash‑Live Предварительный просмотр 2025-04-09 Будет определено

1 Не поддерживается при использовании Gemini Developer API с Firebase AI Logic SDK.

Названия моделей Imagen

Примеры инициализации для вашей платформы см. в руководстве по созданию изображений с помощью Imagen .

Подробную информацию об этапах выпуска (особенно в части вариантов использования и выставления счетов) см. в разделе «Шаблоны управления версиями и именования моделей» .

Названия моделей Imagen 3

Название модели Описание Стадия релиза Дата выпуска Дата выхода на пенсию
imagen-3.0-generate-002 Последняя стабильная версия Imagen 3 Стабильный 2025-01-23 Не ранее 2026-01-23
imagen-3.0-generate-001 2 Первоначальная стабильная версия Imagen 3 Стабильный 2024-07-31 Не ранее 2025-07-31

Названия моделей Imagen 3 Fast

Название модели Описание Стадия релиза Дата выпуска Дата выхода на пенсию
imagen-3.0-fast-generate-001 2 Первоначальная стабильная версия Imagen 3 Fast Стабильный 2024-07-31 Не ранее 2025-07-31

2 Не поддерживается API разработчика Gemini независимо от способа доступа к API.



Поддерживаемые языки

Близнецы

  • Все модели Gemini понимают и могут отвечать на следующих языках:

    Арабский (ar), бенгальский (bn), болгарский (bg), китайский упрощенный и традиционный (zh), хорватский (hr), чешский (cs), датский (da), голландский (nl), английский (en), эстонский (et), финский (fi), французский (fr), немецкий (de), греческий (el), иврит (iw), хинди (hi), венгерский (hu), индонезийский (id), итальянский (it), японский (ja), корейский (ko), латышский (lv), литовский (lt), норвежский (no), польский (pl), португальский (pt), румынский (ro), русский (ru), сербский (sr), словацкий (sk), словенский (sl), испанский (es), суахили (sw), шведский (sv), тайский (th), турецкий (tr), украинский (uk), вьетнамский (vi)

  • Модели Gemini 2.0 Flash , Gemini 1.5 Pro и Gemini 1.5 Flash могут понимать и отвечать на следующих дополнительных языках:

    Африкаанс (af), амхарский (am), ассамский (as), азербайджанский (az), белорусский (be), боснийский (bs), каталанский (ca), кебуанский (ceb), корсиканский (co), валлийский (cy), дивехи (dv), эсперанто (eo), баскский (eu), персидский (fa), филиппинский (тагальский) (fil), фризский (fy), ирландский (ga), шотландский гэльский (gd), галисийский (gl), гуджарати (gu), хауса (ha), гавайский (haw), хмонг (hmn), гаитянский креольский (ht), армянский (hy), игбо (ig), исландский (is), яванский (jv), грузинский (ka), казахский (kk), кхмерский (km), каннада (kn), крио (kri), курдский (ku), кыргызский (ky), латынь (la), люксембургский (lb), лаосский (lo), Малагасийский (мг), маори (ми), македонский (mk), малаялам (ml), монгольский (mn), Meiteilon (Manipuri) (mni-Mtei), маратхи (mr), малайский (ms), мальтийский (mt), мьянманский (бирманский) (my), непальский (ne), ньянджа (чичева) (ny), одиа (ория) (или), пенджабский (pa), пушту (ps), синдхи (sd), сингальский (сингальский) (si), самоанский (sm), шона (sn), сомалийский (so), албанский (sq), сесото (st), суданский (su), тамильский (ta), телугу (te), таджикский (tg), уйгурский (ug), урду (ur), узбекский (uz), коса (xh), идиш (yi), йоруба (yo), зулу (zu)

Изображение

  • Общая доступность : английский

  • Предварительный просмотр : китайский (упрощенный), китайский (традиционный), хинди, японский, корейский, португальский, испанский



Информация о старых моделях

Firebase AI Logic поддерживает старые активные модели Gemini (например, модели Gemini 1.5 ).

Firebase AI Logic не поддерживает старые модели Imagen (например, Imagen 2 ).

Модель Вход Выход Оптимизировано для
Близнецы 1.5 Про
gemini-1.5-pro-002
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON Поддерживает сложные задачи на рассуждение, требующие большего интеллекта; контекст длиной 2 млн.
Близнецы 1.5 Флэш
gemini-1.5-flash-002
текст, код, PDF-файлы, изображения, видео, аудио текст, код, JSON Обеспечивает быструю и универсальную производительность при выполнении самых разных задач
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
текст, код, PDF-файлы, изображения, видео (только кадры) текст, код Обрабатывает текст, изображения и видео для текстовых или кодовых ответов. Не может использоваться для чата.
Близнецы 1.0 Про
gemini-1.0-pro-002
текст, код текст, код Задачи на естественном языке, многопоточный текст и чат с кодом, а также генерация кода



Следующие шаги

Попробуйте возможности API Gemini