Gemini API กำลังใช้ Firebase AI Logic

สร้างแอปบนอุปกรณ์เคลื่อนที่และเว็บฟีเจอร์ที่ทำงานด้วยระบบ AI ด้วยโมเดล Gemini และ Imagen โดยใช้ Firebase AI Logic

Firebase AI Logic ช่วยให้คุณเข้าถึงโมเดล Generative AI ล่าสุดจาก Google ซึ่งได้แก่ โมเดล Gemini และโมเดล Imagen

หากต้องการเรียก Gemini API หรือ Imagen API โดยตรงจากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บแอปแทนที่จะเป็นฝั่งเซิร์ฟเวอร์ คุณสามารถใช้ Firebase AI Logic SDK ของไคลเอ็นต์ SDK ของไคลเอ็นต์เหล่านี้สร้างขึ้นเพื่อใช้กับแอปบนอุปกรณ์เคลื่อนที่และเว็บโดยเฉพาะ โดยจะมีตัวเลือกการรักษาความปลอดภัยเพื่อป้องกันไคลเอ็นต์ที่ไม่ได้รับอนุญาต รวมถึงการผสานรวมกับบริการอื่นๆ ของ Firebase

SDK ของไคลเอ็นต์เหล่านี้พร้อมใช้งานใน Swift สําหรับแพลตฟอร์ม Apple, Kotlin และ Java สําหรับ Android, JavaScript สําหรับเว็บ, Dart สําหรับ Flutter และ Unity

SDK ของไคลเอ็นต์เหล่านี้ช่วยให้คุณเพิ่มการปรับให้เหมาะกับผู้ใช้แต่ละรายด้วย AI ลงในแอป สร้างประสบการณ์การแชทด้วย AI สร้างการเพิ่มประสิทธิภาพและการทำงานอัตโนมัติที่ทำงานด้วยระบบ AI และอีกมากมาย

เริ่มต้นใช้งาน


หากต้องการความยืดหยุ่นหรือการผสานรวมฝั่งเซิร์ฟเวอร์มากขึ้น
Genkit คือเฟรมเวิร์กแบบโอเพนซอร์สของ Firebase สําหรับการพัฒนา AI ฝั่งเซิร์ฟเวอร์ที่มีความซับซ้อน พร้อมการเข้าถึงโมเดลจาก Google, OpenAI, Anthropic และอื่นๆ อย่างครอบคลุม ซึ่งรวมถึงฟีเจอร์ AI ขั้นสูงมากขึ้นและเครื่องมือเฉพาะสำหรับอุปกรณ์

ความสามารถหลัก

อินพุตหลายรูปแบบและภาษาธรรมชาติ โมเดล Gemini ทำงานได้หลายรูปแบบ ดังนั้นพรอมต์ที่ส่งไปยัง Gemini API จึงมีได้ทั้งข้อความ รูปภาพ PDF วิดีโอ และเสียง

ทั้งโมเดล Gemini และ Imagen สามารถใช้พรอมต์กับอินพุตภาษาธรรมชาติได้

ชุดความสามารถที่เพิ่มขึ้น เมื่อใช้ SDK คุณจะเรียกใช้ Gemini API หรือ Imagen API ได้โดยตรงจากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บเพื่อสร้างประสบการณ์การแชทด้วย AI, สร้างรูปภาพ, ใช้การเรียกใช้ฟังก์ชัน (เครื่องมือ), สตรีมอินพุตและเอาต์พุต (รวมถึงเสียง) และอื่นๆ
การรักษาความปลอดภัยและการป้องกันการละเมิดสำหรับแอปเวอร์ชันที่ใช้งานจริง ใช้ Firebase App Check เพื่อช่วยปกป้อง API ที่เข้าถึงโมเดล Gemini และ Imagen จากการละเมิดโดยไคลเอ็นต์ที่ไม่ได้รับอนุญาต

Firebase AI Logic ยังมีขีดจำกัดอัตราต่อผู้ใช้ โดยค่าเริ่มต้น และขีดจำกัดอัตราต่อผู้ใช้เหล่านี้สามารถกำหนดค่าได้อย่างเต็มที่

โครงสร้างพื้นฐานที่มีประสิทธิภาพ ใช้ประโยชน์จากโครงสร้างพื้นฐานที่ปรับขนาดได้ซึ่งสร้างขึ้นเพื่อใช้กับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอป เช่น การจัดการไฟล์ด้วย Cloud Storage for Firebase, การจัดการ Structured Data ด้วยข้อเสนอฐานข้อมูล Firebase (เช่น Cloud Firestore) และการตั้งค่ารันไทม์แบบไดนามิกด้วย Firebase Remote Config

วิธีการทำงาน

Firebase AI Logic มี SDK ของไคลเอ็นต์ บริการพร็อกซี และฟีเจอร์อื่นๆ ซึ่งช่วยให้คุณเข้าถึงโมเดล Generative AI ของ Google เพื่อสร้างฟีเจอร์ AI ในแอปบนอุปกรณ์เคลื่อนที่และเว็บ

การรองรับโมเดลของ Google และผู้ให้บริการ "Gemini API"

เรารองรับ Gemini รุ่นล่าสุดและ Imagen 3 ทุกรุ่น และคุณเลือกผู้ให้บริการ "Gemini API" ที่ต้องการเพื่อเข้าถึงโมเดลเหล่านี้ได้ เรารองรับทั้ง Gemini Developer API และ Vertex AI Gemini API ดูข้อมูลเกี่ยวกับความแตกต่างระหว่างการใช้ผู้ให้บริการ API ทั้ง 2 ราย

และหากเลือกใช้ Gemini Developer API คุณก็ใช้ประโยชน์จาก "แพ็กเกจแบบไม่มีค่าใช้จ่าย" ของแพลตฟอร์มนี้ได้เพื่อให้คุณเริ่มต้นใช้งานได้อย่างรวดเร็ว

SDK ของไคลเอ็นต์เว็บและอุปกรณ์เคลื่อนที่

คุณส่งคําขอไปยังโมเดลได้โดยตรงจากอุปกรณ์เคลื่อนที่หรือเว็บแอปโดยใช้ Firebase AI LogicSDK ของไคลเอ็นต์ ซึ่งมีให้บริการใน Swift สําหรับแพลตฟอร์ม Apple, Kotlin และ Java สําหรับ Android, JavaScript สําหรับเว็บ, Dart สําหรับ Flutter และ Unity

หากตั้งค่าGemini APIผู้ให้บริการทั้ง 2 รายในโปรเจ็กต์ Firebase แล้ว คุณจะสลับระหว่างผู้ให้บริการ API ได้โดยเปิดใช้ API อีกรายและเปลี่ยนโค้ดการเริ่มต้นเพียงไม่กี่บรรทัด

นอกจากนี้ SDK ไคลเอ็นต์สําหรับเว็บยังมีการทดลองเข้าถึงการอนุมานแบบผสมและในอุปกรณ์สําหรับเว็บแอปที่ทํางานใน Chrome บนเดสก์ท็อป การกําหนดค่านี้ช่วยให้แอปใช้โมเดลในอุปกรณ์ได้เมื่อพร้อมใช้งาน แต่ถอยกลับไปใช้โมเดลที่โฮสต์ในระบบคลาวด์ได้อย่างราบรื่นเมื่อจําเป็น

บริการพร็อกซี

บริการพร็อกซีของเราทำหน้าที่เป็นเกตเวย์ระหว่างไคลเอ็นต์กับผู้ให้บริการGemini APIที่คุณเลือก (และโมเดลของ Google) ซึ่งให้บริการและการผสานรวมที่สําคัญสําหรับแอปบนอุปกรณ์เคลื่อนที่และแอปบนเว็บ เช่น คุณสามารถตั้งค่า Firebase App Check เพื่อช่วยปกป้องผู้ให้บริการ API ที่เลือกและทรัพยากรแบ็กเอนด์จากการละเมิดโดยไคลเอ็นต์ที่ไม่ได้รับอนุญาต

ซึ่งสำคัญอย่างยิ่งหากคุณเลือกใช้Gemini Developer API เนื่องจากบริการพร็อกซีของเราและการผสานรวม App Check นี้ช่วยให้มั่นใจได้ว่าคีย์ Gemini API จะยังคงอยู่ในเซิร์ฟเวอร์และไม่ได้ฝังอยู่ในโค้ดเบสของแอป

เส้นทางการใช้งาน

ตั้งค่าโปรเจ็กต์ Firebase และเชื่อมต่อแอปกับ Firebase ใช้เวิร์กโฟลว์แบบมีคําแนะนําในหน้า Firebase AI Logic ของคอนโซล Firebase เพื่อตั้งค่าโปรเจ็กต์ (รวมถึงเปิดใช้ API ที่จําเป็นสําหรับผู้ให้บริการ Gemini API ที่เลือก) ลงทะเบียนแอปกับโปรเจ็กต์ Firebase แล้วเพิ่มการกําหนดค่า Firebase ลงในแอป
ติดตั้ง SDK และเริ่มต้นใช้งาน ติดตั้ง Firebase AI Logic SDK ที่เจาะจงสำหรับแพลตฟอร์มของแอป จากนั้นเริ่มต้นใช้งานบริการและสร้างอินสแตนซ์โมเดลในแอป
ส่งคําขอพรอมต์ไปยังโมเดล Gemini และ Imagen ใช้ SDK เพื่อส่งพรอมต์แบบข้อความเท่านั้นหรือแบบหลายสื่อไปยังGeminiรูปแบบเพื่อสร้างข้อความและโค้ด เอาต์พุตที่มีโครงสร้าง (เช่น JSON) และรูปภาพ หรือจะป้อนพรอมต์ให้Imagenโมเดลสร้างรูปภาพก็ได้

สร้างประสบการณ์การใช้งานที่สมบูรณ์ยิ่งขึ้นด้วยแชทแบบหลายรอบ การสตรีมข้อความและเสียงแบบ 2 ทิศทาง และการเรียกใช้ฟังก์ชัน

เตรียมพร้อมสำหรับเวอร์ชันที่ใช้งานจริง ใช้การผสานรวมที่สําคัญสําหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บ เช่น การปกป้อง API จากการละเมิดด้วย Firebase App Check และการใช้ Firebase Remote Config เพื่ออัปเดตพารามิเตอร์ในโค้ดจากระยะไกล (เช่น ชื่อรุ่น)

ขั้นตอนถัดไป

เริ่มต้นใช้งานการเข้าถึงโมเดลจากอุปกรณ์เคลื่อนที่หรือเว็บแอป

ไปที่คู่มือเริ่มต้นใช้งาน

ดูข้อมูลเพิ่มเติมเกี่ยวกับรูปแบบที่รองรับ

ดูข้อมูลเกี่ยวกับรูปแบบที่ใช้ได้กับกรณีการใช้งานต่างๆ รวมถึงโควต้าและราคา