지원되는 모델 알아보기

모바일 및 웹 앱의 경우 Firebase AI Logic SDK를 사용하면 앱에서 지원되는 Gemini 모델Imagen 3 모델과 직접 상호작용할 수 있습니다.

Gemini 모델은 텍스트, 코드, PDF, 이미지, 동영상, 오디오를 비롯한 여러 모달을 처리하고 생성할 수 있으므로 멀티모달로 간주됩니다. Imagen 3 모델은 텍스트를 사용하여 이미지를 생성하도록 프롬프트할 수 있습니다.

다음 표는 Firebase AI Logic에 지원되는 모델과 최신 안정적인 모델 이름에 관한 간단한 개요입니다. 이 표에는 사용 사례 프로토타입 제작에 사용할 수 있는 미리보기 및 실험용 모델도 나와 있습니다.

모델 입력 출력 설명
안정화 버전이 있는 Gemini 모델
Gemini 2.0 Flash
gemini-2.0-flash-001
텍스트, 코드, PDF, 이미지, 동영상, 오디오 텍스트, 코드, JSON
(이미지 및 오디오는 곧 제공 예정!)
빠른 속도, 기본 제공 도구 사용, 토큰 컨텍스트 윈도우 100만 개(멀티모달 생성 기능은 곧 제공 예정) 등 차세대 기능과 향상된 기능을 갖춘 멀티모달 모델
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
텍스트, 코드, PDF, 이미지, 동영상, 오디오 텍스트, 코드, JSON 가장 빠르고 경제적인 Flash 모델입니다. 동일한 가격과 속도로 더 나은 품질을 원하는 1.5 Flash 사용자를 위한 업그레이드 경로입니다.
미리보기 및 실험 버전 있는 Gemini 모델 (프로토타입 제작 사용 사례에만 권장됨)
Gemini 2.5 Pro
gemini-2.5-pro-preview-05-06
텍스트, 코드, PDF, 이미지, 동영상, 오디오 텍스트, 코드, JSON 복잡한 문제를 해결할 수 있는 Google의 가장 진보된 추론 모델입니다.
Gemini 2.5 Flash
gemini-2.5-flash-preview-04-17
텍스트, 코드, PDF, 이미지, 동영상, 오디오 텍스트, 코드, JSON Google의 사고 모델은 우수하고 다재다능한 기능을 제공합니다. 가격과 성능 간의 균형을 제공하도록 설계되었습니다.
Gemini 2.0 Flash‑Live 1
gemini-2.0-flash-live-preview-04-09
텍스트 (스트리밍),
오디오 (스트리밍)
텍스트 (스트리밍),
오디오 (스트리밍)
멀티모달 입력과 출력의 지연 시간이 짧은 실시간 스트리밍을 지원하는 멀티모달 모델입니다.
Imagen 3 모델 (Firebase AI Logic와 함께 사용할 때)
Imagen 3
imagen-3.0-generate-002
텍스트 이미지 자연어 텍스트 프롬프트에서 사실적이고 고품질의 이미지를 생성합니다.
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
텍스트 이미지 프로토타입 제작 또는 지연 시간이 짧은 사용 사례를 위한 이미지를 생성합니다.

1 Firebase AI Logic SDK와 함께 Gemini Developer API를 사용하는 경우 지원되지 않습니다.
2 API에 액세스하는 방법과 관계없이 Gemini Developer API에서 지원되지 않습니다.

또한 Firebase AI Logic에서 지원하는 모델과 지원하지 않는 모델에 관한 FAQ를 검토하세요.


이 페이지의 나머지 부분에서는 Firebase AI Logic에서 지원하는 모델에 관한 자세한 정보를 제공합니다.

이 페이지 하단에서 이전 모델에 관한 자세한 정보를 확인할 수 있습니다.



모델 비교

각 모델은 다양한 사용 사례를 지원하기 위해 서로 다른 기능을 제공합니다. 이 섹션의 각 표는 Firebase AI Logic와 함께 사용할 때 각 모델을 설명합니다. 각 모델에는 Google SDK를 사용할 때 사용할 수 없는 추가 기능이 있을 수 있습니다.

다음 하위 섹션에서 원하는 정보를 찾을 수 없는 경우 선택한 API 제공업체 문서에서 자세한 내용을 확인할 수 있습니다.

지원되는 입력 및 출력

다음은 Firebase AI Logic와 함께 각 모델을 사용할 때 지원되는 입력 및 출력 유형입니다.

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 플래시 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
입력 유형
텍스트
텍스트 (스트리밍)
코드
문서
(PDF 또는 일반 텍스트)
이미지
동영상
오디오
오디오 (스트리밍)
출력 유형
텍스트
텍스트 (스트리밍)
코드
구조화된 출력
(예: JSON)
이미지 제공 예정
오디오 제공 예정
오디오 (스트리밍)

지원되는 파일 형식에 대한 자세한 내용은 지원되는 입력 파일 및 요구사항을 참고하세요.

지원되는 기능

다음은 Firebase AI Logic과 함께 각 모델을 사용할 때 지원되는 기능입니다.

<span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 플래시 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
텍스트 전용 또는 멀티모달 입력에서 텍스트 생성 스트리밍만 해당
이미지 생성
(Imagen 3)
제공 예정
오디오 생성 제공 예정 스트리밍만 해당
구조화된 출력 생성
(예: JSON)
문서 분석
(PDF 또는 일반 텍스트)
이미지 분석(비전)
동영상 분석(비전)
오디오 분석하기 스트리밍만 해당
멀티턴 채팅
함수 호출 (도구)
토큰 수 집계
시스템 안내
양방향 멀티모달 스트리밍

사양 및 제한사항

Firebase AI Logic와 함께 각 모델을 사용할 때 적용되는 사양 및 제한사항은 다음과 같습니다.

속성 <span="notranslate">Gemini
2.5 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 플래시 </span="notranslate">
<span="notranslate">Gemini
2.0 Flash </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Lite </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen 3 /
Imagen 3 Fast
컨텍스트 창 *
총 토큰 한도
(입력+출력 합산)
토큰 1,048,576개 토큰 1,048,576개 토큰 1,048,576개 토큰 1,048,576개 토큰 32,768개 토큰 480개
출력 토큰 한도 * 토큰 65,536개 토큰 65,536개 토큰 8,192개 토큰 8,192개 --- ---
지식 단절 날짜 2025년 1월 2025년 1월 2024년 6월 2024년 6월 2024년 8월 ---
PDF (요청 시)
입력 PDF 파일
최대 개수 **
파일 3,000개 파일 3,000개 파일 3,000개 파일 3,000개 --- ---
입력 PDF 파일당 최대
페이지 수
**
1,000페이지 1,000페이지 1,000페이지 1,000페이지 --- ---
입력 PDF 파일당 최대 크기
50MB 50MB 50MB 50MB --- ---
이미지 (요청당)
입력 이미지의 최대
개수
이미지 3,000개 이미지 3,000개 이미지 3,000개 이미지 3,000개 --- ---
출력 이미지의 최대 개수
--- --- 제공 예정 --- --- 이미지 4개
입력 base64로 인코딩된 이미지당 최대 크기
7 MB 7 MB 7 MB 7 MB --- ---
동영상 (요청당)
입력 동영상 파일의 최대
파일 10개 파일 10개 파일 10개 파일 10개 --- ---
모든 입력 동영상
의 최대 길이
(프레임만 해당)
~60분 ~60분 ~60분 ~60분 --- ---
모든 입력 동영상
의 최대 길이
(프레임+오디오)
약 45분 약 45분 약 45분 약 45분 --- ---
오디오 (요청 시)
입력 오디오 파일
최대 개수
파일 1개 파일 1개 파일 1개 파일 1개 --- ---
출력 오디오 파일
최대 개수
--- --- 제공 예정 --- --- ---
모든 입력 오디오의 최대 길이
최대 8.4시간 최대 8.4시간 최대 8.4시간 최대 8.4시간 --- ---
모든 출력 오디오의 최대 길이
--- --- 제공 예정 --- --- ---

* 모든 Gemini 모델에서 토큰은 약 4자(영문 기준)에 해당하므로 100개의 토큰은 약 60~80단어에 해당합니다. Gemini 모델의 경우 countTokens를 사용하여 요청의 총 토큰 수를 확인할 수 있습니다.

** PDF는 이미지로 취급되므로 PDF의 한 페이지는 하나의 이미지로 취급됩니다. 요청에서 허용되는 페이지 수는 모델이 지원할 수 있는 이미지 수로 제한됩니다.

추가 세부정보 찾기



모델 버전 관리 및 이름 지정 패턴

모델은 안정화, 미리보기, 실험용 버전으로 제공됩니다. 편의를 위해 명시적인 버전 값이 없는 별칭이 지원됩니다.

코드에서 사용할 특정 모델 이름을 찾으려면 이 페이지 뒷부분의 '사용 가능한 모델 이름' 섹션을 참고하세요.

버전 유형 /
출시 단계
설명 모델 이름 패턴
안정화 버전 안정화 버전은 출시일로부터 프로덕션에 사용할 수 있으며 지원됩니다.

안정화 버전은 일반적으로 모델을 사용할 수 있는 마지막 날짜를 나타내는 지원 종료일과 함께 출시됩니다. 이 날짜 이후에는 Google에서 더 이상 모델에 액세스하거나 지원할 수 없습니다.

안정화 버전의 모델 이름에는 특정 세 자리 버전 번호가 추가됩니다.

예: gemini-2.0-flash-001
예: imagen-3.0-generate-002

자동 업데이트 안정화 버전 별칭 자동 업데이트 안정화 별칭은 항상 해당 모델의 최신 안정화 버전을 가리킵니다. 새 안정화 버전이 출시되면 자동 업데이트 별칭이 새 안정화 버전을 자동으로 가리키기 시작합니다.

별칭의 모델 이름에 부속 항목이 없음

예: gemini-2.0-flash

미리보기 미리보기 버전에는 새로운 기능이 있으며 안정적이지 않은 것으로 간주됩니다.

미리보기 버전은 항상 해당 모델의 최신 미리보기 버전을 가리킵니다. 새 미리보기 버전이 출시되면 기존 미리보기 버전이 자동으로 새 미리보기 버전을 가리키기 시작합니다.

이러한 모델은 프로덕션 사용에 권장되지 않으며, 더 엄격한 비율 제한이 적용되며 결제 요구사항이 있을 수 있습니다.

미리보기 버전의 모델 이름에는 모델의 출시일 (-MM-DD)과 함께 -preview이 추가됩니다.

예: gemini-2.5-flash-preview-04-17
(2025년 4월 17일에 출시됨)

실험용 실험용 버전에는 새로운 기능이 있으며 안정적이지 않은 것으로 간주됩니다.

이러한 모델은 프로덕션용으로 권장되지 않으며 더 엄격한 비율 제한이 적용됩니다. 실험 모델은 의견을 수집하고 최신 기능을 실험하기 위한 것입니다.

실험 버전의 모델 이름에는 모델의 출시일 (-MM-DD)과 함께 -exp이 추가됩니다.

예: gemini-2.5-pro-exp-03-25
(2025년 3월 25일에 출시됨)

은퇴자 지원 중단 버전은 지원 중단일이 지났으며 영구적으로 비활성화되었습니다.

지원 중단된 모델은 더 이상 액세스하거나 Google에서 지원하지 않습니다. 지원 중단된 모델 ID를 참조하는 요청은 일반적으로 404 오류를 반환합니다.

---



사용 가능한 모델 이름

모델 이름은 모델 초기화 중에 코드에 포함하는 명시적 값입니다.

프로그래매틱 방식으로 사용 가능한 모든 모델 나열

REST API를 사용하여 사용 가능한 모든 모델 이름을 나열할 수 있습니다.

반환된 목록에는 API 제공업체에서 지원하는 모든 모델이 포함되지만 Firebase AI Logic는 이 페이지에 설명된 GeminiImagen 모델만 지원합니다. 또한 자동 업데이트 별칭 (예: gemini-2.0-flash)은 기본 모델의 편의 별칭이므로 표시되지 않습니다.

Gemini 모델 이름

플랫폼의 초기화 예는 시작 가이드를 참고하세요.

출시 단계 (특히 사용 사례 및 결제)에 관한 자세한 내용은 모델 버전 관리 및 이름 지정 패턴을 참고하세요.

Gemini 2.5 Pro 모델 이름

모델 이름 설명 출시 단계 출시일 지원 중단일
gemini-2.5-pro-preview-05-06 Gemini 2.5 Pro의 미리보기 버전 미리보기 2025-05-06 미정
gemini-2.5-pro-preview-03-25 gemini-2.5-pro-preview-05-06
(최신 미리보기 버전)을 가리키는 미리보기 버전
미리보기 2025년 3월 25일 미정

Gemini 2.5 Flash 모델 이름

모델 이름 설명 출시 단계 출시일 지원 중단일
gemini-2.5-flash-preview-04-17 Gemini 2.5 Flash의 미리보기 버전 미리보기 2025-04-17 미정

Gemini 2.0 Flash 모델 이름

모델 이름 설명 출시 단계 출시일 지원 중단일
gemini-2.0-flash-001 Gemini 2.0 Flash의 최신 안정화 버전 정식 2025-02-05
2026-02-05 이후
gemini-2.0-flash 2.0 Flash의 최신 안정화 버전을 가리키는 자동 업데이트 별칭
(현재 gemini-2.0-flash-001)
정식 2025-02-10 ---

Gemini 2.0 Flash‑Lite 모델 이름

모델 이름 설명 출시 단계 출시일 지원 중단일
gemini-2.0-flash-lite-001 Gemini 2.0 Flash‑Lite의 최신 안정화 버전 정식 2025-02-25
2026-02-25 이전
gemini-2.0-flash-lite 2.0 Flash-Lite
최신 안정화 버전을 가리키는 자동 업데이트 별칭(현재 gemini-2.0-flash-lite-001)
정식 2025-02-25 ---

Gemini 2.0 Flash‑Live 모델 이름

Vertex AI Gemini API를 API 제공업체로 사용하는 경우에만 사용할 수 있습니다.

모델 이름 설명 출시 단계 출시일 지원 중단일
gemini-2.0-flash-live-preview-04-09 1 Gemini 2.0 Flash‑Live의 미리보기 버전 미리보기 2025-04-09 미정

1 Firebase AI Logic SDK와 함께 Gemini Developer API를 사용하는 경우 지원되지 않습니다.

Imagen 모델 이름

플랫폼의 초기화 예시는 Imagen로 이미지 생성 가이드를 참고하세요.

출시 단계 (특히 사용 사례 및 결제)에 관한 자세한 내용은 모델 버전 관리 및 이름 지정 패턴을 참고하세요.

Imagen 3 모델 이름

모델 이름 설명 출시 단계 출시일 지원 중단일
imagen-3.0-generate-002 Imagen 3의 최신 안정화 버전 정식 2025-01-23 2026년 1월 23일 이후
imagen-3.0-generate-001 2 Imagen 3의 초기 안정화 버전 정식 2024-07-31 2025년 7월 31일 이후

Imagen 3 Fast 모델 이름

모델 이름 설명 출시 단계 출시일 지원 중단일
imagen-3.0-fast-generate-001 2 Imagen 3 Fast의 초기 안정화 버전 정식 2024-07-31 2025년 7월 31일 이후

2 API에 액세스하는 방법과 관계없이 Gemini Developer API에서 지원되지 않습니다.



지원 언어

Gemini

  • 모든 Gemini 모델은 다음 언어를 이해하고 응답할 수 있습니다.

    한국어(ko), 아랍어(ar), 벵골어(bn), 불가리아어(bg), 중국어 간체 및 번체(zh), 크로아티아어(hr), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 에스토니아(et), 핀란드어(fi), 프랑스어(fr), 독일어(de), 그리스어(el), 히브리어(iw), 힌디어(hi), 헝가리어(hu), 인도네시아어(id), 이탈리아어(it), 일본어(ja), 라트비아어(lv), 리투아니아어(lt), 노르웨이어(no), 폴란드어(pl), 포르투갈어(pt), 루마니아어(ro), 러시아어(ru), 세르비아어(sr), 슬로바키아어(sk), 슬로베니아어(sl), 스페인어(es), 스와힐리어(sw), 스웨덴어(sv), 태국어(th), 튀르키예어(tr), 우크라이나어(uk), 베트남어(vi)

  • Gemini 2.0 Flash, Gemini 1.5 Pro, Gemini 1.5 Flash 모델은 다음 추가 언어를 이해하고 응답할 수 있습니다.

    아프리칸스어(af), 암하라어(am), 아삼어(as), 아제르바이잔어(az), 벨라루스어(be), 보스니아어(bs), 카탈루냐어(ca), 세부아노(ceb), 코르시카어(co), 웨일즈어(cy), 디베히어(dv), 에스페란토(eo), 바스크어(eu), 페르시아어(fa), 필리핀어(타갈로그어)(fil), 프리지아어(fy), 아일랜드(ga), 스코틀랜드 게일어(gd), 갈리시아어(gl), 구자라트어(gu), 하우사(ha), 하와이어(haw), 몽어(hmn), 하이티어(ht), 아르메니아(hy), 이그보어(ig), 아이슬란드어(is), 자바어(jv), 조지아어(ka), 카자흐어(kk), 크메르(km), 칸나다어(kn), 크리오(kri), 쿠르드어(ku), 키르기스어(ky) 라틴어(la), 룩셈부르크어(lb), 라오어(lo), 말라가시어(mg), 마오리어(mi), 마케도니아어(mk), 말라얄람어(ml), 몽골어(mn), 메이테이어(마니푸르어)(mni-Mtei), 마라티어(mr), 말레이어(ms), 몰타어(mt), 미얀마(버마어)(my), 네팔어(ne), 니안자(치셰와)(ny), 오리디아(오리야어)(or), 펀자브어(pa), 파슈토(ps), 신디어(sd), 싱할라어(싱할라어)(si), 사모아어(sm), 쇼나(sn), 소말리어(so), 알바니아어(sq), 세소토어(st), 순다어(su), 타밀어(ta), 텔루구(te), 타지크(tg), 위구르(ug), 우르두어(ur), 우즈베크(uz), 코사어(xh), 이디시어(yi), 요루바어(yo), 줄루어(zu)

Imagen

  • 정식 버전: 영어

  • 미리보기: 중국어 (간체), 중국어 (번체), 힌디어, 일본어, 한국어, 포르투갈어, 스페인어



이전 모델에 대한 정보

Firebase AI Logic는 이전의 활성 Gemini 모델(예: Gemini 1.5 모델)을 지원합니다.

Firebase AI Logic는 이전 Imagen 모델(예: Imagen 2)을 지원하지 않습니다.

모델 입력 출력 최적화 목표
Gemini 1.5 Pro
gemini-1.5-pro-002
텍스트, 코드, PDF, 이미지, 동영상, 오디오 텍스트, 코드, JSON 더 많은 지능이 필요한 복잡한 추론 작업을 지원합니다. 2백만 개의 긴 컨텍스트
Gemini 1.5 Flash
gemini-1.5-flash-002
텍스트, 코드, PDF, 이미지, 동영상, 오디오 텍스트, 코드, JSON 다양한 작업에서 빠르고 다재다능한 성능 제공
Gemini 1.0 Pro Vision
gemini-1.0-pro-vision-001
텍스트, 코드, PDF, 이미지, 동영상 (프레임만 해당) 텍스트, 코드 텍스트 또는 코드 응답의 텍스트, 이미지, 동영상을 처리합니다. 채팅에는 사용할 수 없습니다.
Gemini 1.0 Pro
gemini-1.0-pro-002
텍스트, 코드 텍스트, 코드 자연어 태스크, 멀티턴 텍스트 및 코드 채팅, 코드 생성



다음 단계

Gemini API의 기능 사용해 보기