Gemini API กำลังใช้ Firebase AI Logic
สร้างแอปบนอุปกรณ์เคลื่อนที่และเว็บฟีเจอร์ที่ทำงานด้วยระบบ AI ด้วยโมเดล Gemini และ Imagen โดยใช้ Firebase AI Logic
Firebase AI Logic ช่วยให้คุณเข้าถึงโมเดล Generative AI ล่าสุดจาก Google ซึ่งได้แก่ โมเดล Gemini และโมเดล Imagen
หากต้องการเรียก Gemini API หรือ Imagen API โดยตรงจากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บแอปแทนที่จะเป็นฝั่งเซิร์ฟเวอร์ คุณสามารถใช้ Firebase AI Logic SDK ของไคลเอ็นต์ SDK ของไคลเอ็นต์เหล่านี้สร้างขึ้นเพื่อใช้กับแอปบนอุปกรณ์เคลื่อนที่และเว็บโดยเฉพาะ โดยจะมีตัวเลือกการรักษาความปลอดภัยเพื่อป้องกันไคลเอ็นต์ที่ไม่ได้รับอนุญาต รวมถึงการผสานรวมกับบริการอื่นๆ ของ Firebase
SDK ของไคลเอ็นต์เหล่านี้พร้อมใช้งานใน Swift สําหรับแพลตฟอร์ม Apple, Kotlin และ Java สําหรับ Android, JavaScript สําหรับเว็บ, Dart สําหรับ Flutter และ Unity
SDK ของไคลเอ็นต์เหล่านี้ช่วยให้คุณเพิ่มการปรับให้เหมาะกับผู้ใช้แต่ละรายด้วย AI ลงในแอป สร้างประสบการณ์การแชทด้วย AI สร้างการเพิ่มประสิทธิภาพและการทำงานอัตโนมัติที่ทำงานด้วยระบบ AI และอีกมากมาย
หากต้องการความยืดหยุ่นหรือการผสานรวมฝั่งเซิร์ฟเวอร์มากขึ้น
Genkit คือเฟรมเวิร์กแบบโอเพนซอร์สของ Firebase สําหรับการพัฒนา AI ฝั่งเซิร์ฟเวอร์ที่มีความซับซ้อน พร้อมการเข้าถึงโมเดลจาก Google, OpenAI, Anthropic และอื่นๆ อย่างครอบคลุม ซึ่งรวมถึงฟีเจอร์ AI ขั้นสูงมากขึ้นและเครื่องมือเฉพาะสำหรับอุปกรณ์
ความสามารถหลัก
อินพุตหลายรูปแบบและภาษาธรรมชาติ |
โมเดล Gemini ทำงานได้หลายรูปแบบ ดังนั้นพรอมต์ที่ส่งไปยัง Gemini API จึงมีได้ทั้งข้อความ รูปภาพ PDF วิดีโอ และเสียง
ทั้งโมเดล Gemini และ Imagen สามารถใช้พรอมต์กับอินพุตภาษาธรรมชาติได้ |
ชุดความสามารถที่เพิ่มขึ้น | เมื่อใช้ SDK คุณจะเรียกใช้ Gemini API หรือ Imagen API ได้โดยตรงจากแอปบนอุปกรณ์เคลื่อนที่หรือเว็บเพื่อสร้างประสบการณ์การแชทด้วย AI, สร้างรูปภาพ, ใช้การเรียกใช้ฟังก์ชัน (เครื่องมือ), สตรีมอินพุตและเอาต์พุต (รวมถึงเสียง) และอื่นๆ |
การรักษาความปลอดภัยและการป้องกันการละเมิดสำหรับแอปเวอร์ชันที่ใช้งานจริง |
ใช้ Firebase App Check เพื่อช่วยปกป้อง API ที่เข้าถึงโมเดล Gemini และ Imagen จากการละเมิดโดยไคลเอ็นต์ที่ไม่ได้รับอนุญาต
Firebase AI Logic ยังมีขีดจำกัดอัตราต่อผู้ใช้ โดยค่าเริ่มต้น และขีดจำกัดอัตราต่อผู้ใช้เหล่านี้สามารถกำหนดค่าได้อย่างเต็มที่ |
โครงสร้างพื้นฐานที่มีประสิทธิภาพ | ใช้ประโยชน์จากโครงสร้างพื้นฐานที่ปรับขนาดได้ซึ่งสร้างขึ้นเพื่อใช้กับแอปบนอุปกรณ์เคลื่อนที่และเว็บแอป เช่น การจัดการไฟล์ด้วย Cloud Storage for Firebase, การจัดการ Structured Data ด้วยข้อเสนอฐานข้อมูล Firebase (เช่น Cloud Firestore) และการตั้งค่ารันไทม์แบบไดนามิกด้วย Firebase Remote Config |
วิธีการทำงาน
Firebase AI Logic มี SDK ของไคลเอ็นต์ บริการพร็อกซี และฟีเจอร์อื่นๆ ซึ่งช่วยให้คุณเข้าถึงโมเดล Generative AI ของ Google เพื่อสร้างฟีเจอร์ AI ในแอปบนอุปกรณ์เคลื่อนที่และเว็บ
การรองรับโมเดลของ Google และผู้ให้บริการ "Gemini API"
เรารองรับ Gemini รุ่นล่าสุดและ Imagen 3 ทุกรุ่น และคุณเลือกผู้ให้บริการ "Gemini API" ที่ต้องการเพื่อเข้าถึงโมเดลเหล่านี้ได้ เรารองรับทั้ง Gemini Developer API และ Vertex AI Gemini API ดูข้อมูลเกี่ยวกับความแตกต่างระหว่างการใช้ผู้ให้บริการ API ทั้ง 2 ราย
และหากเลือกใช้ Gemini Developer API คุณก็ใช้ประโยชน์จาก "แพ็กเกจแบบไม่มีค่าใช้จ่าย" ของแพลตฟอร์มนี้ได้เพื่อให้คุณเริ่มต้นใช้งานได้อย่างรวดเร็ว
SDK ของไคลเอ็นต์เว็บและอุปกรณ์เคลื่อนที่
คุณส่งคําขอไปยังโมเดลได้โดยตรงจากอุปกรณ์เคลื่อนที่หรือเว็บแอปโดยใช้ Firebase AI LogicSDK ของไคลเอ็นต์ ซึ่งมีให้บริการใน Swift สําหรับแพลตฟอร์ม Apple, Kotlin และ Java สําหรับ Android, JavaScript สําหรับเว็บ, Dart สําหรับ Flutter และ Unity
หากตั้งค่าGemini APIผู้ให้บริการทั้ง 2 รายในโปรเจ็กต์ Firebase แล้ว คุณจะสลับระหว่างผู้ให้บริการ API ได้โดยเปิดใช้ API อีกรายและเปลี่ยนโค้ดการเริ่มต้นเพียงไม่กี่บรรทัด
นอกจากนี้ SDK ไคลเอ็นต์สําหรับเว็บยังมีการทดลองเข้าถึงการอนุมานแบบผสมและในอุปกรณ์สําหรับเว็บแอปที่ทํางานใน Chrome บนเดสก์ท็อป การกําหนดค่านี้ช่วยให้แอปใช้โมเดลในอุปกรณ์ได้เมื่อพร้อมใช้งาน แต่ถอยกลับไปใช้โมเดลที่โฮสต์ในระบบคลาวด์ได้อย่างราบรื่นเมื่อจําเป็น
บริการพร็อกซี
บริการพร็อกซีของเราทำหน้าที่เป็นเกตเวย์ระหว่างไคลเอ็นต์กับผู้ให้บริการGemini APIที่คุณเลือก (และโมเดลของ Google) ซึ่งให้บริการและการผสานรวมที่สําคัญสําหรับแอปบนอุปกรณ์เคลื่อนที่และแอปบนเว็บ เช่น คุณสามารถตั้งค่า Firebase App Check เพื่อช่วยปกป้องผู้ให้บริการ API ที่เลือกและทรัพยากรแบ็กเอนด์จากการละเมิดโดยไคลเอ็นต์ที่ไม่ได้รับอนุญาต
ซึ่งสำคัญอย่างยิ่งหากคุณเลือกใช้Gemini Developer API เนื่องจากบริการพร็อกซีของเราและการผสานรวม App Check นี้ช่วยให้มั่นใจได้ว่าคีย์ Gemini API จะยังคงอยู่ในเซิร์ฟเวอร์และไม่ได้ฝังอยู่ในโค้ดเบสของแอป
เส้นทางการใช้งาน
ตั้งค่าโปรเจ็กต์ Firebase และเชื่อมต่อแอปกับ Firebase | ใช้เวิร์กโฟลว์แบบมีคําแนะนําในหน้า Firebase AI Logic ของคอนโซล Firebase เพื่อตั้งค่าโปรเจ็กต์ (รวมถึงเปิดใช้ API ที่จําเป็นสําหรับผู้ให้บริการ Gemini API ที่เลือก) ลงทะเบียนแอปกับโปรเจ็กต์ Firebase แล้วเพิ่มการกําหนดค่า Firebase ลงในแอป | |
ติดตั้ง SDK และเริ่มต้นใช้งาน | ติดตั้ง Firebase AI Logic SDK ที่เจาะจงสำหรับแพลตฟอร์มของแอป จากนั้นเริ่มต้นใช้งานบริการและสร้างอินสแตนซ์โมเดลในแอป | |
ส่งคําขอพรอมต์ไปยังโมเดล Gemini และ Imagen | ใช้ SDK เพื่อส่งพรอมต์แบบข้อความเท่านั้นหรือแบบหลายสื่อไปยังGeminiรูปแบบเพื่อสร้างข้อความและโค้ด เอาต์พุตที่มีโครงสร้าง (เช่น JSON) และรูปภาพ
หรือจะป้อนพรอมต์ให้Imagenโมเดลสร้างรูปภาพก็ได้
สร้างประสบการณ์การใช้งานที่สมบูรณ์ยิ่งขึ้นด้วยแชทแบบหลายรอบ การสตรีมข้อความและเสียงแบบ 2 ทิศทาง และการเรียกใช้ฟังก์ชัน |
|
เตรียมพร้อมสำหรับเวอร์ชันที่ใช้งานจริง | ใช้การผสานรวมที่สําคัญสําหรับแอปบนอุปกรณ์เคลื่อนที่และเว็บ เช่น การปกป้อง API จากการละเมิดด้วย Firebase App Check และการใช้ Firebase Remote Config เพื่ออัปเดตพารามิเตอร์ในโค้ดจากระยะไกล (เช่น ชื่อรุ่น) |
ขั้นตอนถัดไป
เริ่มต้นใช้งานการเข้าถึงโมเดลจากอุปกรณ์เคลื่อนที่หรือเว็บแอป