Más información sobre los modelos compatibles

En el caso de las apps para dispositivos móviles y la Web, los SDKs de Firebase AI Logic te permiten interactuar con los modelos de Gemini y los modelos de Imagen compatibles directamente desde tu app.

Los modelos Gemini se consideran multimodales porque son capaces de procesar y hasta generar múltiples modalidades, como texto, código, PDFs, imágenes, video y audio. Se puede solicitar a los modelos Imagen que generen imágenes a partir de texto.

En la siguiente tabla, se incluye una breve descripción general de los modelos compatibles con Firebase AI Logic y sus nombres de modelos estables más recientes. En esta tabla, también se enumeran los modelos experimentales y de vista previa que están disponibles para los casos de uso de creación de prototipos.

Además, consulta nuestras preguntas frecuentes sobre todos los modelos que Firebase AI Logic admite y no admite.

en Gemini modelos

Modelo Entrada Salida Descripción
Modelos Gemini con versiones estables
Gemini 2.5 Pro
gemini-2.5-pro
texto, código, PDFs, imágenes, video y audio Texto, código y JSON Nuestro modelo de razonamiento más avanzado, capaz de resolver problemas complejos.
Gemini 2.5 Flash
gemini-2.5-flash
texto, código, PDFs, imágenes, video y audio Texto, código y JSON Nuestro modelo de pensamiento que ofrece capacidades excelentes y completas. Está diseñado para ofrecer un equilibrio entre precio y rendimiento.
Gemini 2.0 Flash
gemini-2.0-flash-001
texto, código, PDFs, imágenes, video y audio Texto, código y JSON Nuestro modelo multimodal con funciones de nueva generación y capacidades mejoradas, como velocidad superior, uso de herramientas integradas y una ventana de contexto de 1 millón de tokens
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
texto, código, PDFs, imágenes, video y audio Texto, código y JSON Nuestro modelo Flash más rápido y rentable. Es una ruta de actualización para los usuarios de 1.5 Flash que desean una mejor calidad por el mismo precio y velocidad.
Modelos de Gemini con versiones de vista previa y experimentales únicamente (recomendado solo para casos de uso de prototipado)
Gemini 2.5 Flash‑Lite
gemini-2.5-flash-lite-preview-06-17
texto, código, PDFs, imágenes, video y audio Texto, código y JSON Nuestro modelo Gemini más equilibrado, optimizado para casos de uso de latencia baja.
Gemini 2.0 Flash Image Generation
gemini-2.0-flash-preview-image-generation
texto, código, PDFs, imágenes, video y audio Imágenes, texto e imágenes Nuestro modelo multimodal que admite entrada multimodal y salida de imágenes.
Gemini 2.0 Flash Live 1
gemini-2.0-flash-live-preview-04-09
texto (transmisión),
audio (transmisión)
texto (transmisión),
audio (transmisión)
Nuestro modelo multimodal que admite la transmisión en tiempo real de baja latencia de entradas y salidas multimodales.

1 No se admite cuando se usa Gemini Developer API con los SDKs de Firebase AI Logic.

en Imagen modelos

Modelo Entrada Salida Descripción
Modelos Imagen con versiones estables
Imagen 3
imagen-3.0-generate-002
texto imágenes Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural.
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
texto imágenes Genera imágenes para prototipos o casos de uso de baja latencia
Modelos de Imagen con versiones de vista previa y experimentales únicamente (recomendado solo para casos de uso de prototipado)
Imagen 4 2
imagen-4.0-generate-preview-06-06
texto imágenes Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural.
Imagen 4 Fast 2
imagen-4.0-fast-generate-preview-06-06
texto imágenes Genera imágenes para prototipos o casos de uso de baja latencia
Imagen 4 Ultra 2
imagen-4.0-ultra-generate-preview-06-06
texto imágenes Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural.

2 Este modelo Imagen no es compatible con Gemini Developer API, independientemente de cómo accedas a la API.


En el resto de esta página, se proporciona información detallada sobre los modelos compatibles con Firebase AI Logic.

  • Compara modelos:

    • Entrada y salida admitidas
    • Comparación general de las capacidades admitidas
    • Especificaciones y limitaciones, por ejemplo, cantidad máxima de tokens de entrada o longitud máxima del video de entrada
  • Descripción de cómo se versionan los modelos, específicamente sus versiones estable, actualizada automáticamente, preliminar y experimental

  • Listas de nombres de modelos disponibles para incluir en tu código durante la inicialización

  • Listas de idiomas admitidos para los modelos

En la parte inferior de esta página, puedes ver información detallada sobre los modelos anteriores.



Comparar modelos

Cada modelo tiene diferentes capacidades para admitir varios casos de uso. Ten en cuenta que cada una de las tablas de esta sección describe cada modelo cuando se usa con Firebase AI Logic. Cada modelo puede tener capacidades adicionales que no están disponibles cuando se usan nuestros SDKs.

Si no encuentras la información que buscas en las siguientes subsecciones, puedes encontrar aún más información en la documentación del proveedor de la API que elijas:

Entrada y salida admitidas

Estos son los tipos de entrada y salida compatibles cuando se usa cada modelo con Firebase AI Logic:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Generación de imágenes con Gemini
2.0 Flash
</span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
Tipos de entrada
Texto
Texto (transmisión)
Código
Documentos
(PDF o texto sin formato)
Imágenes
Video
Audio
Audio (transmisión)
Tipos de salida
Texto
Texto (transmisión)
Código
Salida estructurada
(como JSON)
Imágenes
Audio
Audio (transmisión)

Para obtener información sobre los tipos de archivos admitidos, consulta Archivos de entrada y requisitos admitidos.

Funciones y capacidades admitidas

Estas son las funciones y capacidades compatibles cuando se usa cada modelo con Firebase AI Logic:

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Generación de imágenes con Gemini
2.0 Flash
</span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
Generar texto a partir de entradas de solo texto o multimodales Intercalado o como parte de la imagen Solo transmisión
Generar imágenes
(Gemini o Imagen)
Generar audio Solo transmisión
Genera un resultado estructurado
(como JSON)
Analizar documentos
(archivos PDF o texto sin formato)
Analiza imágenes (visión)
Analiza videos (visión)
Analiza el audio Solo transmisión
Chat de varios turnos
Llamadas a función (herramientas)
Recuento de tokens
Instrucciones del sistema
Transmisión multimodal bidireccional

Especificaciones y limitaciones

Estas son las especificaciones y limitaciones cuando se usa cada modelo con Firebase AI Logic:

Propiedad <span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Flash </span="notranslate">
<span="notranslate">Gemini
2.5 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Generación de imágenes con Gemini
2.0 Flash
</span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen
Ventana de contexto *
Límite total de tokens
(entrada y salida combinadas)
1,048,576 tokens 1,048,576 tokens 1,048,576 tokens 1,048,576 tokens 1,048,576 tokens 32,768 tokens 32,768 tokens 480 tokens
Límite de tokens de salida * 65,536 tokens 65,536 tokens 65,536 tokens 8,192 tokens 8,192 tokens 8,192 tokens 8,192 tokens ---
Fecha límite de conocimiento Enero de 2025 Enero de 2025 Enero de 2025 Junio de 2024 Junio de 2024 Agosto de 2024 Agosto de 2024 ---
PDFs (por solicitud)
Cantidad máxima
de archivos PDF de entrada **
3,000 archivos 3,000 archivos 3,000 archivos 3,000 archivos 3,000 archivos 3,000 archivos --- ---
Cantidad máxima
de páginas
por archivo PDF de entrada **
1,000 páginas 1,000 páginas 1,000 páginas 1,000 páginas 1,000 páginas 1,000 páginas --- ---
Tamaño máximo
por archivo PDF de entrada
50 MB 50 MB 50 MB 50 MB 50 MB 50 MB --- ---
Imágenes (por solicitud)
Cantidad máxima
de imágenes de entrada
3,000 imágenes 3,000 imágenes 3,000 imágenes 3,000 imágenes 3,000 imágenes 3,000 imágenes --- ---
Cantidad máxima
de imágenes de salida
--- --- --- --- --- 10 imágenes --- 4 imágenes
Tamaño máximo
por imagen de entrada codificada en base64
7 MB 7 MB 7 MB 7 MB 7 MB 7 MB --- ---
Video (por solicitud)
Cantidad máxima
de archivos de video de entrada
10 archivos 10 archivos 10 archivos 10 archivos 10 archivos 10 archivos --- ---
Longitud máxima
de todo el video de entrada
(solo fotogramas)
60 minutos aprox. 60 minutos aprox. 60 minutos aprox. 60 minutos aprox. 60 minutos aprox. 60 minutos aprox. --- ---
Longitud máxima
de todo el video de entrada
(fotogramas y audio)
45 minutos aprox. 45 minutos aprox. 45 minutos aprox. 45 minutos aprox. 45 minutos aprox. 45 minutos aprox. --- ---
Audio (por solicitud)
Cantidad máxima
de archivos de audio de entrada
1 archivo 1 archivo 1 archivo 1 archivo 1 archivo 1 archivo --- ---
Cantidad máxima
de archivos de audio de salida
--- --- --- --- --- --- --- ---
Longitud máxima
de todo el audio de entrada
Aprox. 8.4 horas Aprox. 8.4 horas Aprox. 8.4 horas Aprox. 8.4 horas Aprox. 8.4 horas Aprox. 8.4 horas --- ---
Longitud máxima
de todo el audio de salida
--- --- --- --- --- --- --- ---

* Para todos los modelos Gemini, un token equivale a alrededor de 4 caracteres, por lo que 100 tokens equivalen a entre 60 y 80 palabras en inglés. En el caso de los modelos Gemini, puedes determinar el recuento total de tokens en tus solicitudes con countTokens.

** Los PDFs se tratan como imágenes, por lo que una sola página de un PDF se considera una imagen. La cantidad de páginas permitidas en una solicitud se limita a la cantidad de imágenes que el modelo puede admitir.

Encuentra información detallada adicional



Patrones de nomenclatura y control de versiones de modelos

Los modelos se ofrecen en versiones estables, de vista previa y experimentales. Para mayor comodidad, se admiten alias sin valores de versión explícitos.

Para encontrar nombres de modelos específicos que puedes usar en tu código, consulta la sección "Nombres de modelos disponibles" más adelante en esta página.

Tipo de versión /
Etapa de lanzamiento
Descripción Patrón del nombre del modelo
Estable Las versiones estables están disponibles y se admiten para el uso en producción a partir de la fecha de lanzamiento.

Por lo general, las versiones de modelos estables se lanzan con una fecha de retiro, que indica el último día en que el modelo está disponible. Después de esta fecha, Google ya no admitirá el modelo ni se podrá acceder a él.

  • Modelos de Gemini 2.5
    Los nombres de los modelos de versiones estables no tienen sufijo.

    Ejemplo: gemini-2.5-pro

  • Modelos Gemini 2.0 y Imagen
    Los nombres de los modelos de versiones estables se agregan con un número de versión específico de tres dígitos.

    Ejemplo: gemini-2.0-flash-001
    Ejemplo: imagen-3.0-generate-002

Alias estable actualizado automáticamente
(solo modelos de Gemini 2.0)
Los alias estables actualizados automáticamente siempre apuntan a la versión estable más reciente de ese modelo. Si se lanza una nueva versión estable, el alias actualizado automáticamente comenzará a hacer referencia automáticamente a esa nueva versión estable.

Solo modelos Gemini 2.0
Los nombres de los modelos de los alias no tienen sufijo

Ejemplo: gemini-2.0-flash

Vista previa Las versiones de vista previa tienen nuevas capacidades y se consideran inestables.

No se recomienda usar estos modelos en producción, tienen límites de frecuencia más restrictivos y pueden tener requisitos de facturación.

En el caso de Vertex AI Gemini API, los modelos de versión preliminar lanzados después de junio de 2025 suelen requerir que establezcas la ubicación del modelo en global.

Los nombres de los modelos de las versiones preliminares se complementan con -preview junto con la fecha de lanzamiento del modelo (-MM-DD).

Ejemplo: gemini-2.5-flash-preview-04-17
(lanzado el 17 de abril de 2025)

Experimental Las versiones experimentales tienen nuevas capacidades y se consideran inestables.

Estos modelos no se recomiendan para el uso en producción y tienen límites de frecuencia más restrictivos. Los modelos experimentales están diseñados para recopilar comentarios y permitir la experimentación con nuestras funciones más recientes.

En el caso de Vertex AI Gemini API, los modelos experimentales lanzados después de junio de 2025 requieren que establezcas la ubicación del modelo en global.

Los nombres de los modelos de las versiones experimentales se agregan con -exp junto con la fecha de lanzamiento del modelo (-MM-DD).

Ejemplo: gemini-2.5-pro-exp-03-25
(se lanzó el 25 de marzo de 2025)

Jubilado Las versiones retiradas ya pasaron su fecha de retiro y se desactivaron de forma permanente.

Google ya no admite los modelos retirados ni se puede acceder a ellos, y las solicitudes que hacen referencia a un ID de modelo retirado suelen devolver un error 404.

---



Nombres de modelos disponibles

Los nombres de los modelos son los valores explícitos que incluyes en tu código durante la inicialización del modelo.

Enumera de forma programática todos los modelos disponibles

Puedes enumerar todos los nombres de los modelos disponibles con la API de REST:

Ten en cuenta que esta lista devuelta incluirá todos los modelos compatibles con los proveedores de la API, pero Firebase AI Logic solo admite los modelos Gemini y Imagen que se describen en esta página. También ten en cuenta que los alias actualizados automáticamente (por ejemplo, gemini-2.0-flash) no se incluyen en la lista porque son alias convenientes para el modelo base.

Nombres de modelos Gemini

Para ver ejemplos de inicialización para tu plataforma, consulta la guía de introducción.

Para obtener detalles sobre las etapas de lanzamiento (especialmente para los casos de uso y la facturación), consulta los patrones de nomenclatura y control de versiones de los modelos.

Nombres de modelos Gemini 2.5 Pro

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
gemini-2.5-pro Versión estable más reciente de Gemini 2.5 Pro Estable 2025-06-17 No antes del
2026-06-17
gemini-2.5-pro-preview-06-05 Versión preliminar que apunta a la versión estable más reciente de Gemini 2.5 Pro
(actualmente gemini-2.5-pro)
Vista previa 2025-06-05 A partir del
2025-07-15
gemini-2.5-pro-preview-05-06 Versión preliminar que apunta a la versión estable más reciente de Gemini 2.5 Pro*
(actualmente gemini-2.5-pro)
Vista previa 2025-05-06 A partir del
2025-07-15
gemini-2.5-pro-preview-03-25 Versión preliminar que apunta a la versión estable más reciente de Gemini 2.5 Pro*
(actualmente gemini-2.5-pro)
Vista previa 25-03-2025 A partir del
2025-07-15

* Las versiones preliminares existentes de los modelos Gemini 2.5 Pro comenzarán a apuntar a la versión estable el 19 de junio de 2025.

Nombres de modelos Gemini 2.5 Flash

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
gemini-2.5-flash Versión estable más reciente de Gemini 2.5 Flash Estable 2025-06-17 No antes del
2026-06-17
gemini-2.5-flash-preview-05-20 Versión preliminar que apunta a la versión estable más reciente de Gemini 2.5 Flash
(actualmente gemini-2.5-flash)
Vista previa 2025-05-20 A partir del
2025-07-15
gemini-2.5-flash-preview-04-17 Versión preliminar que apunta a la versión estable más reciente de Gemini 2.5 Flash*
(actualmente gemini-2.5-flash)
Vista previa 2025-04-17 A partir del
2025-07-15

* Las versiones preliminares existentes de los modelos Gemini 2.5 Flash comenzarán a apuntar a la versión estable el 19 de junio de 2025.

Nombres de modelos Gemini 2.5 Flash‑Lite

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
gemini-2.5-flash-lite-preview-06-17 Versión inicial de vista previa de Gemini 2.5 Flash‑Lite Vista previa 2025-06-17 Sin establecer

Nombres de modelos Gemini 2.0 Flash

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
gemini-2.0-flash-001 Versión estable más reciente de Gemini 2.0 Flash Estable 2025-02-05 No antes del
2026-02-05
gemini-2.0-flash Alias actualizado automáticamente que apunta a la versión estable más reciente de Gemini 2.0 Flash
(actualmente gemini-2.0-flash-001)
Estable 2025-02-10 ---

Nombres de modelos Gemini 2.0 Flash‑Lite

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
gemini-2.0-flash-lite-001 Versión estable más reciente de Gemini 2.0 Flash‑Lite Estable 2025-02-25 A partir del
2026-02-25
gemini-2.0-flash-lite Alias actualizado automáticamente que apunta a la versión estable más reciente de Gemini 2.0 Flash‑Lite
(actualmente gemini-2.0-flash-lite-001)
Estable 2025-02-25 ---

Nombres de modelos Gemini 2.0 Flash Image Generation

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
gemini-2.0-flash-preview-image-generation 1 Versión preliminar de Gemini 2.0 Flash Image Generation Vista previa 2025-05-06 Sin establecer

Nombres de modelos Gemini 2.0 Flash Live

Solo está disponible cuando usas Vertex AI Gemini API como tu proveedor de la API.

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
gemini-2.0-flash-live-preview-04-09 1 Versión preliminar de Gemini 2.0 Flash Live Vista previa 2025-04-09 Sin establecer

1 No se admite cuando se usa Gemini Developer API con los SDKs de Firebase AI Logic.

Nombres de modelos Imagen

Para ver ejemplos de inicialización para tu plataforma, consulta la guía para generar imágenes con Imagen.

Para obtener detalles sobre las etapas de lanzamiento (especialmente para los casos de uso y la facturación), consulta los patrones de nomenclatura y control de versiones de los modelos.

Nombres de modelos Imagen 4

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
imagen-4.0-generate-preview-06-06 2 Versión preliminar de Imagen 4 Vista previa 2025-06-06 Sin establecer
imagen-4.0-generate-preview-05-20 2 Versión preliminar de Imagen 4 Vista previa 2025-05-20 A partir del 2025-07-07

Nombres de modelos Imagen 4 Fast

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
imagen-4.0-fast-generate-preview-06-06 2 Versión preliminar de Imagen 4 Fast Vista previa 2025-06-06 Sin establecer

Nombres de modelos Imagen 4 Ultra

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
imagen-4.0-ultra-generate-preview-06-06 2 Versión preliminar de Imagen 4 Ultra Vista previa 2025-06-06 Sin establecer
imagen-4.0-ultra-generate-exp-05-20 2 Versión experimental de Imagen 4 Ultra Experimental 2025-05-20 A partir del 2025-07-07

Nombres de modelos Imagen 3

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
imagen-3.0-generate-002 Versión estable más reciente de Imagen 3 Estable 2025-01-23 A partir del 23 de enero de 2026
imagen-3.0-generate-001 2 Versión estable inicial de Imagen 3 Estable 2024-07-31 A partir del 31 de julio de 2025

Nombres de modelos Imagen 3 Fast

Nombre del modelo Descripción Etapa de lanzamiento Fecha de lanzamiento Fecha de baja
imagen-3.0-fast-generate-001 2 Versión estable inicial de Imagen 3 Fast Estable 2024-07-31 A partir del 31 de julio de 2025

2 No es compatible con Gemini Developer API, independientemente de cómo accedas a la API.



Idiomas compatibles

Gemini

  • Todos los modelos de Gemini pueden comprender y responder en los siguientes idiomas:

    Árabe (ar), bengalí (bn), búlgaro (bg), chino (simplificado y tradicional; zh), croata (hr), checo (cs), danés (da), neerlandés (nl), inglés (en), estonio (et), finlandés (fi), francés (fr), alemán (de), griego (el), hebreo (iw), hindi (hi), húngaro (hu), indonesio (id), italiano (it), japonés (ja), coreano (ko), letón (lv), lituano (lt), noruego (no), polaco (pl), portugués (pt), rumano (ro), ruso (ru), serbio (sr), eslovaco (sk), esloveno (sl), español (es), suajili (sw), sueco (sv), tailandés (th), turco (tr), ucraniano (uk) y vietnamita (vi)

  • Los modelos Gemini 2.0 Flash, Gemini 1.5 Pro y Gemini 1.5 Flash pueden comprender y responder en los siguientes idiomas adicionales:

    Afrikaans (af), amhárico (am), asamés (as), azerí (az), bielorruso (be), bosnio (bs), catalán (ca), cebuano (ceb), corso (co), galés (cy), dhivehi (dv), esperanto (eo), euskera (eu), persa (fa), filipino (tagalo) (fil), frisio (fy), irlandés (ga), gaélico escocés (gd), gallego (gl), guyaratí (gu), hausa (ha), hawaiano (haw), hmong (hmn), criollo haitiano (ht), armenio (hy), igbo (ig), islandés (is), javanés (jv), georgiano (ka), kazajo (kk), jemer (km), kannada (kn), krio (kri), kurdo (ku), kirguís (ky), latín (la), luxemburgués (lb), laosiano (lo), malgache (mg), maorí (mi), macedonio (mk), malabar (ml), mongol (mn), meiteilon (manipuri) (mni-Mtei), maratí (mr), malayo (ms), maltés (mt), birmano (my), nepalí (ne), nyanja (chichewa) (ny), oriya (or), panyabí (pa), pastún (ps), sindhi (sd), cingalés (si), samoano (sm), shona (sn), somalí (so), albanés (sq), sesotho (st), sundanés (su), tamil (ta), telugu (te), tayiko (tg), uigur (ug), urdu (ur), uzbeko (uz), xhosa (xh), yidis (yi), yoruba (yo), zulú (zu)

Imagen

  • Disponibilidad general: Inglés

  • Vista previa: Chino (simplificado), chino (tradicional), hindi, japonés, coreano, portugués y español



Información sobre modelos anteriores

Firebase AI Logic admite los modelos Gemini activos anteriores (como los modelos Gemini 1.5).

Firebase AI Logic no admite los modelos Imagen más antiguos (como Imagen 2).

Modelo Entrada Salida Optimizado para
Gemini 1.5 Pro
gemini-1.5-pro-002
texto, código, PDFs, imágenes, video y audio Texto, código y JSON Admite tareas de razonamiento complejas que requieren más inteligencia. Contexto extenso de 2 millones
Gemini 1.5 Flash
gemini-1.5-flash-002
texto, código, PDFs, imágenes, video y audio Texto, código y JSON Ofrece un rendimiento rápido y versátil en una amplia variedad de tareas.
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
texto, código, PDFs, imágenes, video (solo fotogramas) texto, código Maneja texto, imágenes y video para respuestas de texto o código. No se puede usar para el chat.
Gemini 1.0 Pro
gemini-1.0-pro-002
texto, código texto, código Tareas de lenguaje natural, chat de código y texto de varios turnos, y generación de código



Próximos pasos

Prueba las capacidades de Gemini API