En el caso de las apps para dispositivos móviles y la Web, los SDKs de Firebase AI Logic te permiten interactuar con los modelos de Gemini y los modelos de Imagen compatibles directamente desde tu app.
Los modelos Gemini se consideran multimodales porque son capaces de procesar y hasta generar múltiples modalidades, como texto, código, PDFs, imágenes, video y audio. Se puede solicitar a los modelos Imagen que generen imágenes a partir de texto.
En la siguiente tabla, se incluye una breve descripción general de los modelos compatibles con Firebase AI Logic y sus nombres de modelos estables más recientes. En esta tabla, también se enumeran los modelos experimentales y de vista previa que están disponibles para los casos de uso de creación de prototipos.
Además, consulta nuestras preguntas frecuentes sobre todos los modelos que Firebase AI Logic admite y no admite.
en Gemini modelos
Modelo | Entrada | Salida | Descripción |
---|---|---|---|
Modelos Gemini con versiones estables | |||
Gemini 2.5 Progemini-2.5-pro
|
texto, código, PDFs, imágenes, video y audio | Texto, código y JSON | Nuestro modelo de razonamiento más avanzado, capaz de resolver problemas complejos. |
Gemini 2.5 Flashgemini-2.5-flash
|
texto, código, PDFs, imágenes, video y audio | Texto, código y JSON | Nuestro modelo de pensamiento que ofrece capacidades excelentes y completas. Está diseñado para ofrecer un equilibrio entre precio y rendimiento. |
Gemini 2.0 Flashgemini-2.0-flash-001
|
texto, código, PDFs, imágenes, video y audio | Texto, código y JSON | Nuestro modelo multimodal con funciones de nueva generación y capacidades mejoradas, como velocidad superior, uso de herramientas integradas y una ventana de contexto de 1 millón de tokens |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
texto, código, PDFs, imágenes, video y audio | Texto, código y JSON | Nuestro modelo Flash más rápido y rentable. Es una ruta de actualización para los usuarios de 1.5 Flash que desean una mejor calidad por el mismo precio y velocidad. |
Modelos de Gemini con versiones de vista previa y experimentales únicamente (recomendado solo para casos de uso de prototipado) | |||
Gemini 2.5 Flash‑Litegemini-2.5-flash-lite-preview-06-17
|
texto, código, PDFs, imágenes, video y audio | Texto, código y JSON | Nuestro modelo Gemini más equilibrado, optimizado para casos de uso de latencia baja. |
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation
|
texto, código, PDFs, imágenes, video y audio | Imágenes, texto e imágenes | Nuestro modelo multimodal que admite entrada multimodal y salida de imágenes. |
Gemini 2.0 Flash Live 1gemini-2.0-flash-live-preview-04-09
|
texto (transmisión), audio (transmisión) |
texto (transmisión), audio (transmisión) |
Nuestro modelo multimodal que admite la transmisión en tiempo real de baja latencia de entradas y salidas multimodales. |
1 No se admite cuando se usa Gemini Developer API con los SDKs de Firebase AI Logic.
en Imagen modelos
Modelo | Entrada | Salida | Descripción |
---|---|---|---|
Modelos Imagen con versiones estables | |||
Imagen 3imagen-3.0-generate-002 |
texto | imágenes | Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural. |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
texto | imágenes | Genera imágenes para prototipos o casos de uso de baja latencia |
Modelos de Imagen con versiones de vista previa y experimentales únicamente (recomendado solo para casos de uso de prototipado) | |||
Imagen 4 2imagen-4.0-generate-preview-06-06
|
texto | imágenes | Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural. |
Imagen 4 Fast 2imagen-4.0-fast-generate-preview-06-06
|
texto | imágenes | Genera imágenes para prototipos o casos de uso de baja latencia |
Imagen 4 Ultra 2imagen-4.0-ultra-generate-preview-06-06
|
texto | imágenes | Genera imágenes realistas y de alta calidad a partir de instrucciones de texto en lenguaje natural. |
2 Este modelo Imagen no es compatible con Gemini Developer API, independientemente de cómo accedas a la API.
En el resto de esta página, se proporciona información detallada sobre los modelos compatibles con Firebase AI Logic.
-
- Entrada y salida admitidas
- Comparación general de las capacidades admitidas
- Especificaciones y limitaciones, por ejemplo, cantidad máxima de tokens de entrada o longitud máxima del video de entrada
Descripción de cómo se versionan los modelos, específicamente sus versiones estable, actualizada automáticamente, preliminar y experimental
Listas de nombres de modelos disponibles para incluir en tu código durante la inicialización
Listas de idiomas admitidos para los modelos
En la parte inferior de esta página, puedes ver información detallada sobre los modelos anteriores.
Comparar modelos
Cada modelo tiene diferentes capacidades para admitir varios casos de uso. Ten en cuenta que cada una de las tablas de esta sección describe cada modelo cuando se usa con Firebase AI Logic. Cada modelo puede tener capacidades adicionales que no están disponibles cuando se usan nuestros SDKs.
Si no encuentras la información que buscas en las siguientes subsecciones, puedes encontrar aún más información en la documentación del proveedor de la API que elijas:
Gemini Developer API: Modelos de Gemini y modelos de Imagen
Vertex AI Gemini API: Modelos de Gemini y modelos de Imagen
Entrada y salida admitidas
Estos son los tipos de entrada y salida compatibles cuando se usa cada modelo con Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Generación de imágenes con Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | ||
---|---|---|---|---|---|---|---|---|---|
Tipos de entrada | |||||||||
Texto | |||||||||
Texto (transmisión) | |||||||||
Código | |||||||||
Documentos (PDF o texto sin formato) |
|||||||||
Imágenes | |||||||||
Video | |||||||||
Audio | |||||||||
Audio (transmisión) | |||||||||
Tipos de salida | |||||||||
Texto | |||||||||
Texto (transmisión) | |||||||||
Código | |||||||||
Salida estructurada (como JSON) |
|||||||||
Imágenes | |||||||||
Audio | |||||||||
Audio (transmisión) |
Para obtener información sobre los tipos de archivos admitidos, consulta Archivos de entrada y requisitos admitidos.
Funciones y capacidades admitidas
Estas son las funciones y capacidades compatibles cuando se usa cada modelo con Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Generación de imágenes con Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | |
---|---|---|---|---|---|---|---|---|
Generar texto a partir de entradas de solo texto o multimodales | Intercalado o como parte de la imagen | Solo transmisión | ||||||
Generar imágenes (Gemini o Imagen) |
||||||||
Generar audio | Solo transmisión | |||||||
Genera
un resultado estructurado
(como JSON) |
||||||||
Analizar documentos
(archivos PDF o texto sin formato) |
||||||||
Analiza imágenes (visión) | ||||||||
Analiza videos (visión) | ||||||||
Analiza el audio | Solo transmisión | |||||||
Chat de varios turnos | ||||||||
Llamadas a función (herramientas) | ||||||||
Recuento de tokens | ||||||||
Instrucciones del sistema | ||||||||
Transmisión multimodal bidireccional |
Especificaciones y limitaciones
Estas son las especificaciones y limitaciones cuando se usa cada modelo con Firebase AI Logic:
Propiedad |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Generación de imágenes con Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen |
---|---|---|---|---|---|---|---|---|
Ventana de contexto * Límite total de tokens (entrada y salida combinadas) |
1,048,576 tokens | 1,048,576 tokens | 1,048,576 tokens | 1,048,576 tokens | 1,048,576 tokens | 32,768 tokens | 32,768 tokens | 480 tokens |
Límite de tokens de salida * | 65,536 tokens | 65,536 tokens | 65,536 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | 8,192 tokens | --- |
Fecha límite de conocimiento | Enero de 2025 | Enero de 2025 | Enero de 2025 | Junio de 2024 | Junio de 2024 | Agosto de 2024 | Agosto de 2024 | --- |
PDFs (por solicitud) | ||||||||
Cantidad máxima de archivos PDF de entrada ** |
3,000 archivos | 3,000 archivos | 3,000 archivos | 3,000 archivos | 3,000 archivos | 3,000 archivos | --- | --- |
Cantidad máxima de páginas por archivo PDF de entrada ** |
1,000 páginas | 1,000 páginas | 1,000 páginas | 1,000 páginas | 1,000 páginas | 1,000 páginas | --- | --- |
Tamaño máximo por archivo PDF de entrada |
50 MB | 50 MB | 50 MB | 50 MB | 50 MB | 50 MB | --- | --- |
Imágenes (por solicitud) | ||||||||
Cantidad máxima de imágenes de entrada |
3,000 imágenes | 3,000 imágenes | 3,000 imágenes | 3,000 imágenes | 3,000 imágenes | 3,000 imágenes | --- | --- |
Cantidad máxima de imágenes de salida |
--- | --- | --- | --- | --- | 10 imágenes | --- | 4 imágenes |
Tamaño máximo por imagen de entrada codificada en base64 |
7 MB | 7 MB | 7 MB | 7 MB | 7 MB | 7 MB | --- | --- |
Video (por solicitud) | ||||||||
Cantidad máxima de archivos de video de entrada |
10 archivos | 10 archivos | 10 archivos | 10 archivos | 10 archivos | 10 archivos | --- | --- |
Longitud máxima de todo el video de entrada (solo fotogramas) |
60 minutos aprox. | 60 minutos aprox. | 60 minutos aprox. | 60 minutos aprox. | 60 minutos aprox. | 60 minutos aprox. | --- | --- |
Longitud máxima de todo el video de entrada (fotogramas y audio) |
45 minutos aprox. | 45 minutos aprox. | 45 minutos aprox. | 45 minutos aprox. | 45 minutos aprox. | 45 minutos aprox. | --- | --- |
Audio (por solicitud) | ||||||||
Cantidad máxima de archivos de audio de entrada |
1 archivo | 1 archivo | 1 archivo | 1 archivo | 1 archivo | 1 archivo | --- | --- |
Cantidad máxima de archivos de audio de salida |
--- | --- | --- | --- | --- | --- | --- | --- |
Longitud máxima de todo el audio de entrada |
Aprox. 8.4 horas | Aprox. 8.4 horas | Aprox. 8.4 horas | Aprox. 8.4 horas | Aprox. 8.4 horas | Aprox. 8.4 horas | --- | --- |
Longitud máxima de todo el audio de salida |
--- | --- | --- | --- | --- | --- | --- | --- |
*
Para todos los modelos Gemini, un token equivale a alrededor de 4 caracteres,
por lo que 100 tokens equivalen a entre 60 y 80 palabras en inglés. En el caso de los modelos Gemini, puedes determinar el recuento total de tokens en tus solicitudes con countTokens
.
** Los PDFs se tratan como imágenes, por lo que una sola página de un PDF se considera una imagen. La cantidad de páginas permitidas en una solicitud se limita a la cantidad de imágenes que el modelo puede admitir.
Encuentra información detallada adicional
Las cuotas y los precios son diferentes para cada modelo. Los precios también dependen de la entrada y la salida.
Obtén información sobre los tipos de archivos de entrada admitidos, cómo especificar el tipo de MIME y cómo asegurarte de que tus archivos de entrada y solicitudes multimodales cumplan con los requisitos y sigan las prácticas recomendadas que se indican en Requisitos y tipos de archivos de entrada admitidos.
Patrones de nomenclatura y control de versiones de modelos
Los modelos se ofrecen en versiones estables, de vista previa y experimentales. Para mayor comodidad, se admiten alias sin valores de versión explícitos.
Para encontrar nombres de modelos específicos que puedes usar en tu código, consulta la sección "Nombres de modelos disponibles" más adelante en esta página.
Gemini 2.5Tipo de versión / Etapa de lanzamiento |
Descripción | Patrón del nombre del modelo | |
---|---|---|---|
Estable |
Las versiones estables están disponibles y se admiten para el uso en producción a partir de la fecha de lanzamiento.
Por lo general, las versiones de modelos estables se lanzan con una fecha de retiro, que indica el último día en que el modelo está disponible. Después de esta fecha, Google ya no admitirá el modelo ni se podrá acceder a él. |
|
|
Alias estable actualizado automáticamente (solo modelos de Gemini 2.0) |
Los alias estables actualizados automáticamente siempre apuntan a la versión estable más reciente de ese modelo. Si se lanza una nueva versión estable, el alias actualizado automáticamente comenzará a hacer referencia automáticamente a esa nueva versión estable. |
Solo modelos Gemini 2.0
Ejemplo: |
|
Vista previa |
Las versiones de vista previa tienen nuevas capacidades y se consideran inestables.
No se recomienda usar estos modelos en producción, tienen límites de frecuencia más restrictivos y pueden tener requisitos de facturación.
En el caso de Vertex AI Gemini API, los modelos de versión preliminar lanzados después de junio de 2025 suelen requerir que establezcas la ubicación del modelo en |
Los nombres de los modelos de las versiones preliminares se complementan con
Ejemplo: |
|
Experimental |
Las versiones experimentales tienen nuevas capacidades y se consideran inestables.
Estos modelos no se recomiendan para el uso en producción y tienen límites de frecuencia más restrictivos. Los modelos experimentales están diseñados para recopilar comentarios y permitir la experimentación con nuestras funciones más recientes. En el caso de Vertex AI Gemini API, los modelos experimentales lanzados después de junio de 2025 requieren que establezcas la ubicación del modelo en |
Los nombres de los modelos de las versiones experimentales se agregan con
Ejemplo: |
|
Jubilado |
Las versiones retiradas ya pasaron su fecha de retiro y se desactivaron de forma permanente.
Google ya no admite los modelos retirados ni se puede acceder a ellos, y las solicitudes que hacen referencia a un ID de modelo retirado suelen devolver un error 404. |
--- |
Nombres de modelos disponibles
Los nombres de los modelos son los valores explícitos que incluyes en tu código durante la inicialización del modelo.
Enumera de forma programática todos los modelos disponibles
Puedes enumerar todos los nombres de los modelos disponibles con la API de REST:
Gemini Developer API: Llama al extremo
models.list
.Vertex AI Gemini API: Llama al extremo
publishers.models.list
.
Ten en cuenta que esta lista devuelta incluirá todos los modelos compatibles con los proveedores de la API, pero Firebase AI Logic solo admite los modelos Gemini y Imagen que se describen en esta página.
También ten en cuenta que los alias actualizados automáticamente (por ejemplo, gemini-2.0-flash
) no se incluyen en la lista porque son alias convenientes para el modelo base.
Nombres de modelos Gemini
Para ver ejemplos de inicialización para tu plataforma, consulta la guía de introducción.
Para obtener detalles sobre las etapas de lanzamiento (especialmente para los casos de uso y la facturación), consulta los patrones de nomenclatura y control de versiones de los modelos.
Nombres de modelos Gemini 2.5 Pro
Gemini 2.5El 19 de junio de 2025, todas las versiones preliminares de los modelos Gemini 2.5 Pro comenzarán a apuntar a la versión estable. El 15 de julio de 2025, todas las versiones preliminares de Gemini 2.5 Pro dejarán de funcionar. Actualiza tu código para usar el nombre del modelo de la versión estable antes de esa fecha.
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
gemini-2.5-pro |
Versión estable más reciente de Gemini 2.5 Pro | Estable | 2025-06-17 | No antes del 2026-06-17 |
gemini-2.5-pro-preview-06-05 |
Versión preliminar que apunta a la versión estable más reciente de
Gemini 2.5 Pro (actualmente gemini-2.5-pro |
Vista previa | 2025-06-05 | A partir del 2025-07-15 |
gemini-2.5-pro-preview-05-06 |
Versión preliminar que apunta a la versión estable más reciente de
Gemini 2.5 Pro* (actualmente gemini-2.5-pro |
Vista previa | 2025-05-06 | A partir del 2025-07-15 |
gemini-2.5-pro-preview-03-25 |
Versión preliminar que apunta a la versión estable más reciente de
Gemini 2.5 Pro* (actualmente gemini-2.5-pro |
Vista previa | 25-03-2025 | A partir del 2025-07-15 |
* Las versiones preliminares existentes de los modelos Gemini 2.5 Pro comenzarán a apuntar a la versión estable el 19 de junio de 2025.
Nombres de modelos Gemini 2.5 Flash
Gemini 2.5El 19 de junio de 2025, todas las versiones preliminares de los modelos Gemini 2.5 Flash comenzarán a apuntar a la versión estable. El 15 de julio de 2025, todas las versiones preliminares de Gemini 2.5 Flash dejarán de funcionar. Actualiza tu código para usar el nombre del modelo de la versión estable antes de esa fecha.
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
gemini-2.5-flash |
Versión estable más reciente de Gemini 2.5 Flash | Estable | 2025-06-17 | No antes del 2026-06-17 |
gemini-2.5-flash-preview-05-20 |
Versión preliminar que apunta a la versión estable más reciente de
Gemini 2.5 Flash (actualmente gemini-2.5-flash |
Vista previa | 2025-05-20 | A partir del 2025-07-15 |
gemini-2.5-flash-preview-04-17 |
Versión preliminar que apunta a la versión estable más reciente de
Gemini 2.5 Flash* (actualmente gemini-2.5-flash |
Vista previa | 2025-04-17 | A partir del 2025-07-15 |
* Las versiones preliminares existentes de los modelos Gemini 2.5 Flash comenzarán a apuntar a la versión estable el 19 de junio de 2025.
Nombres de modelos Gemini 2.5 Flash‑Lite
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
gemini-2.5-flash-lite-preview-06-17 |
Versión inicial de vista previa de Gemini 2.5 Flash‑Lite | Vista previa | 2025-06-17 | Sin establecer |
Nombres de modelos Gemini 2.0 Flash
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
gemini-2.0-flash-001 |
Versión estable más reciente de Gemini 2.0 Flash | Estable | 2025-02-05 | No antes del 2026-02-05 |
gemini-2.0-flash |
Alias actualizado automáticamente que apunta a la versión estable más reciente de
Gemini 2.0 Flash (actualmente gemini-2.0-flash-001 |
Estable | 2025-02-10 | --- |
Nombres de modelos Gemini 2.0 Flash‑Lite
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Versión estable más reciente de Gemini 2.0 Flash‑Lite | Estable | 2025-02-25 | A partir del 2026-02-25 |
gemini-2.0-flash-lite |
Alias actualizado automáticamente que apunta a la versión estable más reciente de
Gemini 2.0 Flash‑Lite (actualmente gemini-2.0-flash-lite-001 |
Estable | 2025-02-25 | --- |
Nombres de modelos Gemini 2.0 Flash Image Generation
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation 1 |
Versión preliminar de Gemini 2.0 Flash Image Generation | Vista previa | 2025-05-06 | Sin establecer |
Nombres de modelos Gemini 2.0 Flash Live
Solo está disponible cuando usas Vertex AI Gemini API como tu proveedor de la API. |
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Versión preliminar de Gemini 2.0 Flash Live | Vista previa | 2025-04-09 | Sin establecer |
1 No se admite cuando se usa Gemini Developer API con los SDKs de Firebase AI Logic.
Nombres de modelos Imagen
Para ver ejemplos de inicialización para tu plataforma, consulta la guía para generar imágenes con Imagen.
Para obtener detalles sobre las etapas de lanzamiento (especialmente para los casos de uso y la facturación), consulta los patrones de nomenclatura y control de versiones de los modelos.
Nombres de modelos Imagen 4
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
imagen-4.0-generate-preview-06-06 2 |
Versión preliminar de Imagen 4 | Vista previa | 2025-06-06 | Sin establecer |
imagen-4.0-generate-preview-05-20 2 |
Versión preliminar de Imagen 4 | Vista previa | 2025-05-20 | A partir del 2025-07-07 |
Nombres de modelos Imagen 4 Fast
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
imagen-4.0-fast-generate-preview-06-06 2 |
Versión preliminar de Imagen 4 Fast | Vista previa | 2025-06-06 | Sin establecer |
Nombres de modelos Imagen 4 Ultra
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
imagen-4.0-ultra-generate-preview-06-06 2 |
Versión preliminar de Imagen 4 Ultra | Vista previa | 2025-06-06 | Sin establecer |
imagen-4.0-ultra-generate-exp-05-20 2 |
Versión experimental de Imagen 4 Ultra | Experimental | 2025-05-20 | A partir del 2025-07-07 |
Nombres de modelos Imagen 3
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
imagen-3.0-generate-002 |
Versión estable más reciente de Imagen 3 | Estable | 2025-01-23 | A partir del 23 de enero de 2026 |
imagen-3.0-generate-001 2 |
Versión estable inicial de Imagen 3 | Estable | 2024-07-31 | A partir del 31 de julio de 2025 |
Nombres de modelos Imagen 3 Fast
Nombre del modelo | Descripción | Etapa de lanzamiento | Fecha de lanzamiento | Fecha de baja |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Versión estable inicial de Imagen 3 Fast | Estable | 2024-07-31 | A partir del 31 de julio de 2025 |
2 No es compatible con Gemini Developer API, independientemente de cómo accedas a la API.
Idiomas compatibles
Gemini
Todos los modelos de Gemini pueden comprender y responder en los siguientes idiomas:
Árabe (ar), bengalí (bn), búlgaro (bg), chino (simplificado y tradicional; zh), croata (hr), checo (cs), danés (da), neerlandés (nl), inglés (en), estonio (et), finlandés (fi), francés (fr), alemán (de), griego (el), hebreo (iw), hindi (hi), húngaro (hu), indonesio (id), italiano (it), japonés (ja), coreano (ko), letón (lv), lituano (lt), noruego (no), polaco (pl), portugués (pt), rumano (ro), ruso (ru), serbio (sr), eslovaco (sk), esloveno (sl), español (es), suajili (sw), sueco (sv), tailandés (th), turco (tr), ucraniano (uk) y vietnamita (vi)
Los modelos Gemini 2.0 Flash, Gemini 1.5 Pro y Gemini 1.5 Flash pueden comprender y responder en los siguientes idiomas adicionales:
Afrikaans (af), amhárico (am), asamés (as), azerí (az), bielorruso (be), bosnio (bs), catalán (ca), cebuano (ceb), corso (co), galés (cy), dhivehi (dv), esperanto (eo), euskera (eu), persa (fa), filipino (tagalo) (fil), frisio (fy), irlandés (ga), gaélico escocés (gd), gallego (gl), guyaratí (gu), hausa (ha), hawaiano (haw), hmong (hmn), criollo haitiano (ht), armenio (hy), igbo (ig), islandés (is), javanés (jv), georgiano (ka), kazajo (kk), jemer (km), kannada (kn), krio (kri), kurdo (ku), kirguís (ky), latín (la), luxemburgués (lb), laosiano (lo), malgache (mg), maorí (mi), macedonio (mk), malabar (ml), mongol (mn), meiteilon (manipuri) (mni-Mtei), maratí (mr), malayo (ms), maltés (mt), birmano (my), nepalí (ne), nyanja (chichewa) (ny), oriya (or), panyabí (pa), pastún (ps), sindhi (sd), cingalés (si), samoano (sm), shona (sn), somalí (so), albanés (sq), sesotho (st), sundanés (su), tamil (ta), telugu (te), tayiko (tg), uigur (ug), urdu (ur), uzbeko (uz), xhosa (xh), yidis (yi), yoruba (yo), zulú (zu)
Imagen
Disponibilidad general: Inglés
Vista previa: Chino (simplificado), chino (tradicional), hindi, japonés, coreano, portugués y español
Información sobre modelos anteriores
Firebase AI Logic admite los modelos Gemini activos anteriores (como los modelos Gemini 1.5).
Firebase AI Logic no admite los modelos Imagen más antiguos (como Imagen 2).
Modelo | Entrada | Salida | Optimizado para |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
texto, código, PDFs, imágenes, video y audio | Texto, código y JSON | Admite tareas de razonamiento complejas que requieren más inteligencia. Contexto extenso de 2 millones |
Gemini 1.5 Flashgemini-1.5-flash-002 |
texto, código, PDFs, imágenes, video y audio | Texto, código y JSON | Ofrece un rendimiento rápido y versátil en una amplia variedad de tareas. |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
Próximos pasos
Prueba las capacidades de Gemini API
- Crea conversaciones de varios turnos (chat).
- Generar texto a partir de instrucciones solo de texto
- Genera texto a partir de instrucciones con varios tipos de archivos, como imágenes, PDFs, videos y audios.
- Genera resultados estructurados (como JSON) a partir de instrucciones tanto de texto como multimodales.
- Generar imágenes a partir de instrucciones de texto (Gemini o Imagen)
- Transmite entrada y salida (incluido el audio) con Gemini Live API.
- Usa la llamada a función para conectar modelos generativos a sistemas e información externos.