สําหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บ Firebase AI Logic SDK จะช่วยให้คุณโต้ตอบกับรุ่น Gemini และรุ่น Imagen 3 ที่รองรับได้โดยตรงจากแอป
โมเดล Gemini ถือว่าเป็นแบบหลายรูปแบบเนื่องจากสามารถประมวลผลและสร้างรูปแบบต่างๆ ได้มากมาย ซึ่งรวมถึงข้อความ โค้ด PDF รูปภาพ วิดีโอ และเสียง โมเดล Imagen 3 สามารถใช้ข้อความเป็นพรอมต์ในการสร้างรูปภาพได้
ตารางต่อไปนี้เป็นภาพรวมคร่าวๆ ของโมเดลที่รองรับสำหรับ Firebase AI Logic และชื่อโมเดลเวอร์ชันล่าสุดที่เสถียร ตารางนี้ยังแสดงตัวอย่างและโมเดลเวอร์ชันทดลองที่ใช้สำหรับการสร้างต้นแบบ Use Case ได้ด้วย
รุ่น | อินพุต | เอาต์พุต | คำอธิบาย |
---|---|---|---|
Gemini รุ่นที่มีเวอร์ชันเสถียร | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง | ข้อความ โค้ด JSON (รูปภาพและเสียงจะพร้อมใช้งานเร็วๆ นี้) |
โมเดลหลายโมดัลที่มีฟีเจอร์และความสามารถรุ่นถัดไปที่ปรับปรุงแล้ว ซึ่งรวมถึงความเร็วที่เหนือกว่า การใช้เครื่องมือในตัว และหน้าต่างบริบทขนาด 1 ล้านโทเค็น (การสร้างแบบหลายโมดัลจะพร้อมใช้งานเร็วๆ นี้) |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง | ข้อความ โค้ด JSON | โมเดล Flash ที่เร็วที่สุดและคุ้มค่าที่สุด นี่เป็นเส้นทางการอัปเกรดสำหรับผู้ใช้ Flash 1.5 ที่ต้องการคุณภาพที่ดีขึ้นในราคาและความเร็วเดิม |
Gemini รุ่นที่มีเฉพาะเวอร์ชันทดลองและเวอร์ชันตัวอย่าง (แนะนำสำหรับกรณีการใช้งานการสร้างต้นแบบเท่านั้น) | |||
Gemini 2.5 Progemini-2.5-pro-preview-05-06
|
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง | ข้อความ โค้ด JSON | โมเดลการให้เหตุผลที่ล้ำหน้าที่สุดของเราซึ่งสามารถแก้ปัญหาที่ซับซ้อน |
Gemini 2.5 Flashgemini-2.5-flash-preview-04-17
|
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง | ข้อความ โค้ด JSON | รูปแบบการคิดของเราที่มอบความสามารถที่ยอดเยี่ยมและรอบด้าน ฟีเจอร์นี้ออกแบบมาเพื่อมอบความสมดุลระหว่างราคาและประสิทธิภาพ |
Gemini 2.0 Flash‑Live 1gemini-2.0-flash-live-preview-04-09
|
ข้อความ (สตรีมมิง) เสียง (สตรีมมิง) |
ข้อความ (สตรีมมิง) เสียง (สตรีมมิง) |
โมเดลมัลติโมดัลที่รองรับสตรีมมิงแบบเรียลไทม์ที่มีเวลาในการตอบสนองต่ำของอินพุตและเอาต์พุตมัลติโมดัล |
Imagen 3 models (เมื่อใช้กับ Firebase AI Logic) | |||
Imagen 3imagen-3.0-generate-002 |
ข้อความ | รูปภาพ | สร้างรูปภาพคุณภาพสูงสมจริงจากพรอมต์ข้อความที่เป็นภาษาธรรมชาติ |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
ข้อความ | รูปภาพ | สร้างรูปภาพสําหรับการสร้างต้นแบบหรือกรณีการใช้งานที่มีเวลาในการตอบสนองต่ำ |
1 ไม่รองรับเมื่อใช้ Gemini Developer API กับ Firebase AI Logic SDK
2 Gemini Developer API ไม่รองรับไม่ว่าจะเข้าถึง API อย่างไร
นอกจากนี้ โปรดอ่านคําถามที่พบบ่อยเกี่ยวกับรุ่นทั้งหมดที่ Firebase AI Logic รองรับและไม่รองรับ
ส่วนที่เหลือของหน้านี้จะแสดงข้อมูลโดยละเอียดเกี่ยวกับรุ่นที่ Firebase AI Logic รองรับ
-
- อินพุตและเอาต์พุตที่รองรับ
- การเปรียบเทียบความสามารถที่รองรับในระดับสูง
- ข้อกำหนดและข้อจำกัด เช่น โทเค็นอินพุตสูงสุดหรือความยาวสูงสุดของวิดีโออินพุต
คําอธิบายการกําหนดเวอร์ชันโมเดล โดยเฉพาะเวอร์ชันเสถียร อัปเดตอัตโนมัติ เวอร์ชันตัวอย่าง และเวอร์ชันทดลอง
รายการชื่อโมเดลที่ใช้ได้ที่จะรวมไว้ในโค้ดระหว่างการเริ่มต้น
รายการภาษาที่รองรับสำหรับรุ่นต่างๆ
คุณดูข้อมูลโดยละเอียดเกี่ยวกับรุ่นเก่าได้ที่ด้านล่างของหน้านี้
เปรียบเทียบโมเดล
แต่ละรูปแบบมีความสามารถแตกต่างกันเพื่อรองรับกรณีการใช้งานที่หลากหลาย โปรดทราบว่าตารางแต่ละตารางในส่วนนี้จะอธิบายรูปแบบแต่ละรูปแบบเมื่อใช้กับ Firebase AI Logic แต่ละรุ่นอาจมีความสามารถเพิ่มเติมที่ไม่พร้อมใช้งานเมื่อใช้ SDK ของเรา
หากไม่พบข้อมูลที่กําลังมองหาในส่วนย่อยต่อไปนี้ คุณสามารถดูข้อมูลเพิ่มเติมในเอกสารประกอบของผู้ให้บริการ API ที่เลือก
Gemini Developer API: Gemini models and Imagen models
Vertex AI Gemini API: Gemini models and Imagen models
อินพุตและเอาต์พุตที่รองรับ
ประเภทอินพุตและเอาต์พุตที่รองรับเมื่อใช้แต่ละรูปแบบกับ Firebase AI Logic มีดังนี้
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|||
---|---|---|---|---|---|---|---|---|
ประเภทอินพุต | ||||||||
ข้อความ | ||||||||
ข้อความ (สตรีมมิง) | ||||||||
รหัส | ||||||||
เอกสาร (PDF หรือข้อความธรรมดา) |
||||||||
รูปภาพ | ||||||||
วิดีโอ | ||||||||
เสียง | ||||||||
เสียง (สตรีมมิง) | ||||||||
ประเภทเอาต์พุต | ||||||||
ข้อความ | ||||||||
ข้อความ (สตรีมมิง) | ||||||||
รหัส | ||||||||
เอาต์พุตที่มีโครงสร้าง (เช่น JSON) |
||||||||
รูปภาพ | เร็วๆ นี้ | |||||||
เสียง | เร็วๆ นี้ | |||||||
เสียง (สตรีมมิง) |
ดูข้อมูลเกี่ยวกับประเภทไฟล์ที่รองรับได้ที่ไฟล์อินพุตและข้อกำหนดที่รองรับ
ความสามารถและฟีเจอร์ที่รองรับ
ความสามารถและฟีเจอร์ที่รองรับเมื่อใช้แต่ละโมเดลกับ Firebase AI Logic มีดังนี้
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|
สร้างข้อความจากอินพุตที่เป็นข้อความเท่านั้นหรือแบบหลายรูปแบบ | สตรีมมิงเท่านั้น | |||||
สร้างรูปภาพ (Imagen 3) |
เร็วๆ นี้ | |||||
สร้างเสียง | เร็วๆ นี้ | สตรีมมิงเท่านั้น | ||||
สร้าง output ที่มีโครงสร้าง
(เช่น JSON) |
||||||
วิเคราะห์เอกสาร
(PDF หรือข้อความธรรมดา) |
||||||
วิเคราะห์รูปภาพ (วิสัยทัศน์) | ||||||
วิเคราะห์วิดีโอ (วิสัยทัศน์) | ||||||
วิเคราะห์เสียง | สตรีมมิงเท่านั้น | |||||
แชทแบบหลายรอบ | ||||||
การเรียกฟังก์ชัน (เครื่องมือ) | ||||||
นับโทเค็น | ||||||
วิธีการของระบบ | ||||||
การสตรีมแบบหลายสื่อแบบ 2 ทิศทาง |
ข้อกำหนดและข้อจำกัด
ข้อมูลจำเพาะและข้อจำกัดเมื่อใช้แต่ละรุ่นกับ Firebase AI Logic มีดังนี้
พร็อพเพอร์ตี้ |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen 3 / Imagen 3 Fast |
|
---|---|---|---|---|---|---|---|
กรอบเวลาของบริบท * ขีดจํากัดโทเค็นทั้งหมด (อินพุต+เอาต์พุตรวมกัน) |
โทเค็น 1,048,576 รายการ | โทเค็น 1,048,576 รายการ | โทเค็น 1,048,576 รายการ | โทเค็น 1,048,576 รายการ | โทเค็น 32,768 รายการ | โทเค็น 480 รายการ | |
ขีดจํากัดโทเค็นเอาต์พุต * | โทเค็น 65,536 รายการ | โทเค็น 65,536 รายการ | โทเค็น 8,192 รายการ | โทเค็น 8,192 รายการ | --- | --- | |
วันที่ตัดข้อมูล | มกราคม 2025 | มกราคม 2025 | มิถุนายน 2024 | มิถุนายน 2024 | สิงหาคม 2024 | --- | |
PDF (ตามคำขอ) | |||||||
จำนวน ไฟล์ PDF อินพุตสูงสุด ** |
ไฟล์ 3,000 รายการ | ไฟล์ 3,000 รายการ | ไฟล์ 3,000 รายการ | ไฟล์ 3,000 รายการ | --- | --- | |
จำนวน หน้า สูงสุดต่อไฟล์ PDF อินพุต ** |
1,000 หน้า | 1,000 หน้า | 1,000 หน้า | 1,000 หน้า | --- | --- | |
ขนาดสูงสุด ต่อไฟล์ PDF อินพุต |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | |
รูปภาพ (ต่อคำขอ) | |||||||
จํานวนสูงสุด ของรูปภาพอินพุต |
3,000 รูปภาพ | 3,000 รูปภาพ | 3,000 รูปภาพ | 3,000 รูปภาพ | --- | --- | |
จำนวนรูปภาพเอาต์พุตสูงสุด |
--- | --- | เร็วๆ นี้ | --- | --- | รูปภาพ 4 รูป | |
ขนาดสูงสุด ต่อรูปภาพที่เข้ารหัส Base64 ของอินพุต |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | |
วิดีโอ (ตามคำขอ) | |||||||
จํานวน ไฟล์วิดีโออินพุตสูงสุด |
10 ไฟล์ | 10 ไฟล์ | 10 ไฟล์ | 10 ไฟล์ | --- | --- | |
ความยาวสูงสุด ของวิดีโออินพุตทั้งหมด (เฟรมเท่านั้น) |
ประมาณ 60 นาที | ประมาณ 60 นาที | ประมาณ 60 นาที | ประมาณ 60 นาที | --- | --- | |
ความยาวสูงสุด ของวิดีโออินพุตทั้งหมด (เฟรมและเสียง) |
ประมาณ 45 นาที | ประมาณ 45 นาที | ประมาณ 45 นาที | ประมาณ 45 นาที | --- | --- | |
เสียง (ตามคำขอ) | |||||||
จำนวนไฟล์เสียง อินพุตสูงสุด |
1 ไฟล์ | 1 ไฟล์ | 1 ไฟล์ | 1 ไฟล์ | --- | --- | |
จำนวนไฟล์เสียง เอาต์พุตสูงสุด |
--- | --- | เร็วๆ นี้ | --- | --- | --- | |
ความยาวสูงสุด ของเสียงอินพุตทั้งหมด |
ประมาณ 8.4 ชั่วโมง | ประมาณ 8.4 ชั่วโมง | ประมาณ 8.4 ชั่วโมง | ประมาณ 8.4 ชั่วโมง | --- | --- | |
ความยาวสูงสุด ของเสียงเอาต์พุตทั้งหมด |
--- | --- | เร็วๆ นี้ | --- | --- | --- |
*
สำหรับโมเดล Gemini ทั้งหมด โทเค็นจะเท่ากับอักขระประมาณ 4 ตัว
ดังนั้น โทเค็น 100 รายการจึงเท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ สําหรับรุ่น Gemini คุณสามารถระบุจํานวนโทเค็นทั้งหมดในคําขอได้โดยใช้ countTokens
** ระบบจะถือว่า PDF เป็นรูปภาพ ดังนั้นหน้าเดียวของ PDF จะถือว่าเป็นรูปภาพ 1 รูป จำนวนหน้าที่อนุญาตในคำขอจะจํากัดตามจํานวนรูปภาพที่โมเดลรองรับ
ดูรายละเอียดเพิ่มเติม
โควต้าและราคาจะแตกต่างกันไปในแต่ละรุ่น ราคายังขึ้นอยู่กับอินพุตและเอาต์พุตด้วย
ดูข้อมูลเกี่ยวกับประเภทไฟล์อินพุตที่รองรับ วิธีระบุประเภท MIME และวิธีตรวจสอบว่าไฟล์อินพุตและคำขอแบบหลายรูปแบบเป็นไปตามข้อกำหนดและเป็นไปตามแนวทางปฏิบัติแนะนำในไฟล์อินพุตและข้อกำหนดที่รองรับ
รูปแบบการตั้งชื่อและการกำหนดเวอร์ชันของโมเดล
โมเดลมีให้บริการในเวอร์ชันเสถียร เวอร์ชันตัวอย่าง และเวอร์ชันทดลอง ระบบรองรับการใช้อีเมลแทนที่ไม่มีค่าเวอร์ชันที่ชัดเจนเพื่อความสะดวก
หากต้องการดูชื่อรุ่นที่เฉพาะเจาะจงเพื่อใช้ในโค้ด โปรดดูส่วน"ชื่อรุ่นที่ใช้ได้" ในส่วนถัดไปของหน้านี้
ประเภทเวอร์ชัน / ระยะการเผยแพร่ |
คำอธิบาย | รูปแบบชื่อรุ่น | |
---|---|---|---|
เวอร์ชันเสถียร |
เวอร์ชันเสถียรพร้อมใช้งานและรองรับการใช้งานจริงตั้งแต่วันที่เผยแพร่
โดยปกติแล้ว เวอร์ชันโมเดลที่เสถียรจะเปิดตัวพร้อมกับวันที่หยุดให้บริการ ซึ่งระบุวันที่สุดท้ายที่โมเดลจะพร้อมใช้งาน หลังจากวันที่ดังกล่าว Google จะไม่รองรับหรือเข้าถึงรูปแบบนี้ได้อีกต่อไป |
ชื่อโมเดลของเวอร์ชันที่เสถียรจะมีหมายเลขเวอร์ชัน 3 หลักที่เจาะจงต่อท้าย
ตัวอย่าง: |
|
ชื่อแทนที่เสถียรซึ่งอัปเดตอัตโนมัติ | ชื่อแทนที่เสถียรซึ่งอัปเดตอัตโนมัติจะชี้ไปยังรุ่นเสถียรเวอร์ชันล่าสุดของรุ่นนั้นเสมอ หากมีการเผยแพร่เวอร์ชันเสถียรใหม่ อีเมลแทนที่อัปเดตอัตโนมัติจะเริ่มชี้ไปยังเวอร์ชันเสถียรใหม่นั้นโดยอัตโนมัติ |
ชื่อโมเดลของอีเมลแทนจะไม่มีส่วนต่อท้าย
ตัวอย่างเช่น |
|
ตัวอย่าง |
เวอร์ชันเวอร์ชันตัวอย่างมีความสามารถใหม่ๆ และยังไม่เสถียร
เวอร์ชันตัวอย่างจะชี้ไปยังเวอร์ชันตัวอย่าง ล่าสุดของโมเดลนั้นเสมอ หากมีการเผยแพร่เวอร์ชันตัวอย่างใหม่ เวอร์ชันตัวอย่างที่มีอยู่จะเริ่มชี้ไปยังเวอร์ชันตัวอย่างใหม่นั้นโดยอัตโนมัติ เราไม่แนะนำให้ใช้รูปแบบเหล่านี้ในเวอร์ชันที่ใช้งานจริง เนื่องจากมีขีดจำกัดอัตราที่เข้มงวดกว่าและอาจมีข้อกำหนดในการเรียกเก็บเงิน |
ชื่อรุ่นของเวอร์ชันตัวอย่างจะต่อท้ายด้วย
ตัวอย่าง: |
|
ทดลอง |
เวอร์ชันทดลองมีความสามารถใหม่ๆ และถือว่าไม่เสถียร
เราไม่แนะนําให้ใช้โมเดลเหล่านี้ในเวอร์ชันที่ใช้งานจริง และโมเดลเหล่านี้จะมีขีดจํากัดอัตราคำขอที่เข้มงวดกว่า โมเดลเวอร์ชันทดลองมีไว้เพื่อรวบรวมความคิดเห็นและเปิดโอกาสให้ทดลองใช้ฟีเจอร์ล่าสุด |
ชื่อโมเดลของเวอร์ชันทดลองจะต่อท้ายด้วย
ตัวอย่าง: |
|
เกษียณแล้ว |
เวอร์ชันเลิกใช้งานแล้วคือเวอร์ชันที่ผ่านวันที่เลิกใช้งานแล้วและถูกปิดใช้งานอย่างถาวร
Google จะไม่รองรับหรือเข้าถึงโมเดลที่เลิกใช้งานแล้วอีกต่อไป โดยปกติแล้ว คำขอที่อ้างอิงรหัสรุ่นที่เลิกใช้งานจะแสดงข้อผิดพลาด 404 |
--- |
ชื่อโมเดลที่ใช้ได้
ชื่อโมเดลคือค่าที่ชัดเจนซึ่งคุณระบุในโค้ดระหว่างการเริ่มต้นใช้งานโมเดล
แสดงรายการรุ่นที่ใช้ได้ทั้งหมดแบบเป็นโปรแกรม
คุณสามารถแสดงรายการชื่อโมเดลทั้งหมดที่ใช้ได้โดยใช้ REST API ดังนี้
Gemini Developer API: โทรไปที่ปลายทาง
models.list
Vertex AI Gemini API: โทรไปที่ปลายทาง
publishers.models.list
โปรดทราบว่ารายการที่แสดงผลนี้จะรวมรุ่นทั้งหมดที่ผู้ให้บริการ API รองรับ แต่ Firebase AI Logic จะรองรับเฉพาะรุ่น Gemini และ Imagen ที่อธิบายไว้ในหน้านี้
นอกจากนี้ โปรดทราบว่าระบบจะไม่แสดงชื่อแทนที่อัปเดตโดยอัตโนมัติ (เช่น gemini-2.0-flash
) เนื่องจากเป็นชื่อแทนที่สะดวกสำหรับโมเดลพื้นฐาน
ชื่อรุ่น Gemini
ดูตัวอย่างการเริ่มต้นใช้งานสำหรับแพลตฟอร์มของคุณได้ที่คู่มือเริ่มต้นใช้งาน
โปรดดูรายละเอียดเกี่ยวกับระยะการเผยแพร่ (โดยเฉพาะสำหรับกรณีการใช้งานและการเรียกเก็บเงิน) ที่หัวข้อรูปแบบการตั้งชื่อและการกำหนดเวอร์ชันโมเดล
ชื่อรุ่น Gemini 2.5 Pro
ชื่อโมเดล | คำอธิบาย | ระยะการเผยแพร่ | วันที่เผยแพร่ | วันที่เกษียณอายุ |
---|---|---|---|---|
gemini-2.5-pro-preview-05-06 |
เวอร์ชันตัวอย่างของ Gemini 2.5 Pro | แสดงตัวอย่าง | 2025-05-06 | จะแจ้งให้ทราบภายหลัง |
gemini-2.5-pro-preview-03-25 |
เวอร์ชันตัวอย่างที่ชี้ไปที่ gemini-2.5-pro-preview-05-06 (ซึ่งเป็นเวอร์ชันตัวอย่างล่าสุด) |
แสดงตัวอย่าง | 2025-03-25 | จะแจ้งให้ทราบภายหลัง |
ชื่อรุ่น Gemini 2.5 Flash
ชื่อโมเดล | คำอธิบาย | ระยะการเผยแพร่ | วันที่เผยแพร่ | วันที่เกษียณอายุ |
---|---|---|---|---|
gemini-2.5-flash-preview-04-17 |
เวอร์ชันตัวอย่างของ Gemini 2.5 Flash | แสดงตัวอย่าง | 2025-04-17 | จะแจ้งให้ทราบภายหลัง |
ชื่อรุ่น Gemini 2.0 Flash
ชื่อโมเดล | คำอธิบาย | ระยะการเผยแพร่ | วันที่เผยแพร่ | วันที่เกษียณอายุ |
---|---|---|---|---|
gemini-2.0-flash-001 |
Gemini 2.0 Flash เวอร์ชันเสถียรล่าสุด | สังกัด | 2025-02-05 | ไม่เกิน 2026-02-05 |
gemini-2.0-flash |
อีเมลแทนที่อัปเดตอัตโนมัติซึ่งชี้ไปยัง Flash 2.0 เวอร์ชันเสถียรล่าสุด (ปัจจุบันคือ gemini-2.0-flash-001 |
สังกัด | 2025-02-10 | --- |
ชื่อรุ่น Gemini 2.0 Flash‑Lite
ชื่อโมเดล | คำอธิบาย | ระยะการเผยแพร่ | วันที่เผยแพร่ | วันที่เกษียณอายุ |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Gemini 2.0 Flash‑Lite เวอร์ชันเสถียรล่าสุด | สังกัด | 2025-02-25 | ไม่เกิน 2026-02-25 |
gemini-2.0-flash-lite |
อีเมลแทนที่อัปเดตอัตโนมัติซึ่งชี้ไปยัง Flash-Lite 2.0 เวอร์ชันเสถียรล่าสุด (ปัจจุบันคือ gemini-2.0-flash-lite-001 |
สังกัด | 2025-02-25 | --- |
ชื่อรุ่น Gemini 2.0 Flash‑Live
ใช้ได้เฉพาะเมื่อใช้ Vertex AI Gemini API เป็นผู้ให้บริการ API |
ชื่อโมเดล | คำอธิบาย | ระยะการเผยแพร่ | วันที่เผยแพร่ | วันที่เกษียณอายุ |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
เวอร์ชันตัวอย่างสำหรับ Gemini 2.0 Flash‑Live | แสดงตัวอย่าง | 2025-04-09 | จะแจ้งให้ทราบภายหลัง |
1 ไม่รองรับเมื่อใช้ Gemini Developer API กับ Firebase AI Logic SDK
ชื่อรุ่น Imagen
ดูตัวอย่างการเริ่มต้นใช้งานสำหรับแพลตฟอร์มของคุณได้ที่คู่มือสร้างรูปภาพด้วย Imagen
โปรดดูรายละเอียดเกี่ยวกับระยะการเผยแพร่ (โดยเฉพาะสำหรับกรณีการใช้งานและการเรียกเก็บเงิน) ที่หัวข้อรูปแบบการตั้งชื่อและการกำหนดเวอร์ชันโมเดล
ชื่อรุ่น Imagen 3
ชื่อโมเดล | คำอธิบาย | ระยะการเผยแพร่ | วันที่เผยแพร่ | วันที่เกษียณอายุ |
---|---|---|---|---|
imagen-3.0-generate-002 |
Imagen 3 เวอร์ชันเสถียรล่าสุด | สังกัด | 2025-01-23 | ไม่เกินวันที่ 23-01-2026 |
imagen-3.0-generate-001 2 |
Imagen 3 เวอร์ชันเสถียรเริ่มต้น | สังกัด | 2024-07-31 | ไม่เกินวันที่ 31-07-2025 |
ชื่อรุ่น Imagen 3 Fast
ชื่อโมเดล | คำอธิบาย | ระยะการเผยแพร่ | วันที่เผยแพร่ | วันที่เกษียณอายุ |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Imagen 3 Fast เวอร์ชันเสถียรเริ่มต้น | สังกัด | 2024-07-31 | ไม่เกินวันที่ 31-07-2025 |
2 Gemini Developer API ไม่รองรับไม่ว่าจะเข้าถึง API อย่างไร
ภาษาที่สนับสนุน
Gemini
โมเดล Gemini ทั้งหมดจะเข้าใจและตอบกลับได้โดยใช้ภาษาต่อไปนี้
อาหรับ (ar), เบงกอล (bn), บัลแกเรีย (bg), จีน (ตัวย่อและตัวเต็ม) (zh), โครเอเชีย (hr), เช็ก (cs), เดนมาร์ก (da), ดัตช์ (nl), อังกฤษ (en), เอสโตเนีย (et), ฟินแลนด์ (fi), ฝรั่งเศส (fr), เยอรมัน (de), กรีก (el), ฮีบรู (iw), ฮินดี (hi), ฮังการี (hu), อินโดนีเซีย (id), อิตาลี (it), ญี่ปุ่น (ja), เกาหลี (ko), ลัตเวีย (lv), ลิทัวเนีย (lt), นอร์เวย์ (no), โปแลนด์ (pl), โปรตุเกส (pt), โรมาเนีย (ro), รัสเซีย (ru), เซอร์เบีย (sr), สโลวาเกีย (sk), สโลวีเนีย (sl), สเปน (es), สวาฮิลี (sw), สวีเดน (sv), ไทย (th), ตุรกี (tr), ยูเครน (uk), เวียดนาม (vi)
โมเดล Gemini 2.0 Flash, Gemini 1.5 Pro และ Gemini 1.5 Flash สามารถเข้าใจและตอบเป็นภาษาเพิ่มเติมต่อไปนี้
อาหรับ (ar), ไอซ์แลนด์ (is), อินโดนีเซีย (id), อุษาครี (ur), อุซเบก (uz), อังกฤษ (en), อิตาลี (it), อินเดีย (ฮินดี) (hi), อินเดีย (อูรดู) (ur), อินเดีย (ทมิฬ) (ta), อินเดีย (เตลูกู) (te), อินเดีย (มราฐี) (mr), อินเดีย (คุชราต) (gu), อินเดีย (เบงกาลี) (bn), อินเดีย (ปัญจาบ) (pa), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (ฮินดี) (hi), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เตลูกู) (te), อินเดีย (อูรดู) (ur), อินเดีย (แคชเมียร์) (ks), อินเดีย (คุชราต) (gu), อินเดีย (มราฐี) (mr), อินเดีย (เต
Imagen
ความพร้อมให้บริการทั่วไป: อังกฤษ
ตัวอย่าง: จีน (ตัวย่อ), จีน (ตัวเต็ม), ญี่ปุ่น, เกาหลี, โปรตุเกส, สเปน, ฮินดี
ข้อมูลเกี่ยวกับรุ่นเก่า
Firebase AI Logic รองรับรุ่น Gemini ที่ใช้งานอยู่รุ่นเก่า (เช่น รุ่น Gemini 1.5)
Firebase AI Logic ไม่รองรับ Imagen รุ่นเก่า (เช่น Imagen 2)
รุ่น | อินพุต | เอาต์พุต | เพิ่มประสิทธิภาพสำหรับ |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง | ข้อความ โค้ด JSON | รองรับงานที่ต้องใช้เหตุผลที่ซับซ้อนซึ่งต้องใช้ความฉลาดมากขึ้น บริบทยาว 2 ล้านคำ |
Gemini 1.5 Flashgemini-1.5-flash-002 |
ข้อความ โค้ด PDF รูปภาพ วิดีโอ เสียง | ข้อความ โค้ด JSON | มีประสิทธิภาพที่รวดเร็วและหลากหลายสำหรับงานต่างๆ |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
ขั้นตอนถัดไป
ลองใช้ความสามารถของ Gemini API
- สร้างการสนทนาแบบหลายรอบ (แชท)
- สร้างข้อความจากพรอมต์แบบข้อความเท่านั้น
- สร้างข้อความโดยแจ้งให้ทราบด้วยไฟล์ประเภทต่างๆ เช่น รูปภาพ PDF วิดีโอ และ เสียง
- สร้างเอาต์พุตที่มีโครงสร้าง (เช่น JSON) จากทั้งพรอมต์แบบข้อความและแบบมัลติโมเดล
- สร้างรูปภาพจากพรอมต์ข้อความ
- อินพุตและเอาต์พุตสตรีม (รวมถึงเสียง) โดยใช้ Gemini Live API
- ใช้การเรียกฟังก์ชันเพื่อเชื่อมต่อโมเดล Generative กับระบบและข้อมูลภายนอก