All Gemini 1.0 and Gemini 1.5 models are now retired.
To avoid service disruption, update to a newer model (for example, gemini-2.5-flash-lite). Learn more.

דף זה תורגם על ידי Cloud Translation API.

פיתוח חוויות היברידיות באמצעות מודלים במכשיר ובענן

פיתוח אפליקציות ותכונות מבוססות-AI עם הסקה היברידית באמצעות Firebase AI Logic. הסקת מסקנות היברידית מאפשרת להריץ הסקת מסקנות באמצעות מודלים במכשיר כשהם זמינים, ולעבור בצורה חלקה למודלים שמתארחים בענן אם לא (ולהיפך).

בגרסה הזו, ניתן להשתמש בהסקת מסקנות היברידית באמצעות Firebase AI Logic client SDK for Web עם תמיכה בהסקת מסקנות במכשיר עבור Chrome במחשב.

מעבר לדוגמאות קוד

תרחישים מומלצים לדוגמה ויכולות נתמכות

תרחישי שימוש מומלצים:

השימוש במודל היקש במכשיר מציע:
- פרטיות משופרת
- הקשר מקומי
- הסקת מסקנות ללא עלות
- פונקציונליות אופליין
שימוש בהצעות עם פונקציונליות היברידית:
- הגעה ל-100% מהקהל, ללא קשר לזמינות של המודל במכשיר או לחיבור לאינטרנט

יכולות ותכונות נתמכות להסקת מסקנות במכשיר:

יצירת תוכן בשיחה אחת, סטרימינג ולא סטרימינג
יצירת טקסט מקלט טקסט בלבד
יצירת טקסט מקלט של טקסט ותמונה, במיוחד סוגי תמונות קלט של JPEG ו-PNG
יצירת פלט מובנה, כולל JSON וספירות

שנתחיל?

במדריך הזה מוסבר איך להתחיל להשתמש ב-Firebase AI Logic SDK for Web כדי לבצע היסק היברידי.

הסקת מסקנות באמצעות מודל במכשיר מתבצעת באמצעות Prompt API מ-Chrome. לעומת זאת, הסקת מסקנות באמצעות מודל שמתארח בענן מתבצעת באמצעות הספק שבחרתם (Gemini API או Gemini Developer API או Vertex AI Gemini API).

כדאי להתחיל לפתח באמצעות localhost, כמו שמתואר בקטע הזה (אפשר גם לקרוא מידע נוסף על שימוש בממשקי API ב-localhost בתיעוד של Chrome). אחרי שמטמיעים את התכונה, אפשר להפעיל את האפשרות למשתמשי קצה להתנסות בתכונה.

שלב 1: הגדרת Chrome ו-Prompt API להסקת מסקנות במכשיר

מוודאים שאתם משתמשים בגרסה עדכנית של Chrome. עדכון בכתובת chrome://settings/help.
הסקת מסקנות במכשיר זמינה מ-Chrome מגרסה 139 ואילך.
כדי להפעיל את הדגם הרב-אופני במכשיר, מגדירים את הדגל הבא לערך Enabled:
- chrome://flags/#prompt-api-for-gemini-nano-multimodal-input
מפעילים מחדש את Chrome.
(אופציונלי) מורידים את המודל במכשיר לפני הבקשה הראשונה.

ממשק Prompt API מובנה ב-Chrome, אבל המודל במכשיר לא זמין כברירת מחדל. אם לא הורדתם את המודל לפני הבקשה הראשונה להסקת מסקנות במכשיר, הבקשה תתחיל אוטומטית את הורדת המודל ברקע.

הערה: הורדת המודל יכולה להימשך כמה דקות, ולכן אם מחכים להורדה אוטומטית עם הבקשה הראשונה, יכול להיות שיידרש זמן רב עד לקבלת תשובה לבקשה.
הוראות להורדת המודל במכשיר
1. פותחים את הכלים למפתחים > מסוף.
2. מריצים את הפקודה הבאה:
```
await LanguageModel.availability();
```
3. מוודאים שהפלט הוא available,‏ downloading או downloadable.
4. אם הפלט הוא downloadable, מריצים את הפקודה הבאה כדי להתחיל בהורדת המודל:
```
await LanguageModel.create();
```
5. אפשר להשתמש בmonitor callback הבא כדי לעקוב אחרי התקדמות ההורדה ולוודא שהמודל available לפני ששולחים בקשות:
```
const session = await LanguageModel.create({
  monitor(m) {
    m.addEventListener("downloadprogress", (e) => {
      console.log(`Downloaded ${e.loaded * 100}%`);
    });
  },
});
```

שלב 2: הגדרת פרויקט ב-Firebase וקישור האפליקציה ל-Firebase

נכנסים אל Firebase המסוף ובוחרים את הפרויקט ב-Firebase.
עדיין אין לכם פרויקט Firebase?

אם עדיין אין לכם פרויקט ב-Firebase, אתם יכולים ללחוץ על הלחצן כדי ליצור פרויקט חדש ב-Firebase, ואז להשתמש באחת מהאפשרויות הבאות:
- אפשרות 1: יוצרים פרויקט Firebase חדש לגמרי (ואת פרויקט Google Cloud הבסיסי שלו באופן אוטומטי) על ידי הזנת שם פרויקט חדש בשלב הראשון של תהליך העבודה.
- אפשרות 2: מוסיפים את Firebase לפרויקט Google Cloud קיים על ידי לחיצה על הוספת Firebase לפרויקט Google Cloud (בתחתית הדף). בשלב הראשון של תהליך העבודה, מתחילים להזין את שם הפרויקט של הפרויקט הקיים, ואז בוחרים את הפרויקט מהרשימה שמוצגת.
משלימים את שאר השלבים בתהליך העבודה במסך כדי ליצור פרויקט Firebase. שימו לב: כשמוצגת בקשה, לא צריך להגדיר את Google Analytics כדי להשתמש בערכות ה-SDK של Firebase AI Logic.
במסוף Firebase, עוברים לדף Firebase AI Logic.
לוחצים על Get started (תחילת העבודה) כדי להפעיל תהליך עבודה מודרך שיעזור לכם להגדיר את ממשקי ה-API והמשאבים הנדרשים לפרויקט.
בוחרים את ספק Gemini API שרוצים להשתמש בו עם ערכות ה-SDK של Firebase AI Logic. מומלץ למשתמשים חדשים.Gemini Developer API תמיד אפשר להוסיף פרטי חיוב או להגדיר את Vertex AI Gemini API מאוחר יותר.
- ‫Gemini Developer API – חיוב אופציונלי (זמין בתוכנית התמחור Spark ללא עלות, ותוכלו לשדרג בהמשך אם תרצו)
  . במסוף יופעלו ממשקי ה-API הנדרשים ותיצור מפתח API של Gemini בפרויקט.
  אל תוסיפו את מפתח ה-API‏ Gemini הזה לבסיס הקוד של האפליקציה. מידע נוסף
- ‫Vertex AI Gemini API — נדרש חיוב (נדרש תוכנית התמחור Blaze בתשלום לפי שימוש)
  המסוף יעזור לכם להגדיר חיוב ולהפעיל את ממשקי ה-API הנדרשים בפרויקט.
אם מופיעה בקשה בתהליך העבודה של המסוף, פועלים לפי ההוראות במסך כדי לרשום את האפליקציה ולקשר אותה ל-Firebase.
כדי להוסיף את ה-SDK לאפליקציה, ממשיכים לשלב הבא במדריך הזה.

שלב 3: הוספת ה-SDK

ספריית Firebase מספקת גישה לממשקי ה-API לאינטראקציה עם מודלים גנרטיביים. הספרייה כלולה כחלק מ-Firebase JavaScript SDK לאינטרנט.

מתקינים את Firebase JS SDK לאינטרנט באמצעות npm:
```
npm install firebase
```

מפעילים את Firebase באפליקציה:

import { initializeApp } from "firebase/app";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

שלב 4: הפעלת השירות ויצירת מופע של מודל

לוחצים על הספק Gemini API כדי לראות בדף הזה תוכן וקוד שספציפיים לספק.

לפני ששולחים הנחיה למודל Gemini, צריך לאתחל את השירות עבור ספק ה-API שבחרתם וליצור מופע GenerativeModel.

מגדירים את mode לאחד מהערכים הבאים:

‫PREFER_ON_DEVICE: מגדיר את ה-SDK לשימוש במודל במכשיר אם הוא זמין, או לחזרה למודל שמארח בענן.
‫ONLY_ON_DEVICE: הגדרת ה-SDK לשימוש במודל במכשיר או להפעלת חריגה.
‫PREFER_IN_CLOUD: מגדיר את ה-SDK לשימוש במודל שמתארח בענן אם הוא זמין, או לחזרה למודל שפועל במכשיר.
‫ONLY_IN_CLOUD: הגדרת ה-SDK כך שלעולם לא ייעשה שימוש במודל במכשיר.

כשמשתמשים ב-PREFER_ON_DEVICE, ב-PREFER_IN_CLOUD או ב-ONLY_IN_CLOUD, מודל ברירת המחדל שמתארח בענן הוא gemini-2.0-flash-lite, אבל אפשר לבטל את ברירת המחדל.

import { initializeApp } from "firebase/app";
import { getAI, getGenerativeModel, GoogleAIBackend, InferenceMode } from "firebase/ai";

// TODO(developer) Replace the following with your app's Firebase configuration
// See: https://firebase.google.com/docs/web/learn-more#config-object
const firebaseConfig = {
  // ...
};

// Initialize FirebaseApp
const firebaseApp = initializeApp(firebaseConfig);

// Initialize the Gemini Developer API backend service
const ai = getAI(firebaseApp, { backend: new GoogleAIBackend() });

// Create a `GenerativeModel` instance
// Set the mode, for example to use on-device model when possible
const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_ON_DEVICE });

שליחת בקשת הנחיה למודל

בקטע הזה תמצאו דוגמאות לאופן שליחת סוגים שונים של קלט כדי ליצור סוגים שונים של פלט, כולל:

יצירת טקסט מקלט טקסט בלבד
יצירת טקסט מקלט של טקסט ותמונה (מולטימודאלי)

אם רוצים ליצור פלט מובנה (כמו JSON או enums), צריך להשתמש באחת מהדוגמאות הבאות של 'יצירת טקסט' וגם להגדיר את המודל כך שיגיב בהתאם לסכימה שסופקה.

יצירת טקסט מקלט טקסט בלבד

לפני שמנסים את הדוגמה הזו, חשוב לוודא שסיימתם את הקטע תחילת העבודה במדריך הזה.

אתם יכולים להשתמש ב-generateContent() כדי ליצור טקסט מהנחיה שמכילה טקסט:

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Wrap in an async function so you can use await
async function run() {
  // Provide a prompt that contains text
  const prompt = "Write a story about a magic backpack."

  // To generate text output, call `generateContent` with the text input
  const result = await model.generateContent(prompt);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

שימו לב ש-Firebase AI Logic תומך גם בסטרימינג של תשובות טקסט באמצעות generateContentStream (במקום generateContent).

יצירת טקסט מקלט של טקסט ותמונה (מולטי-מודאלי)

לפני שמנסים את הדוגמה הזו, חשוב לוודא שסיימתם את הקטע תחילת העבודה במדריך הזה.

אתם יכולים להשתמש ב-generateContent() כדי ליצור טקסט מהנחיה שמכילה קובצי טקסט ותמונות. לשם כך, צריך לספק את mimeType של כל קובץ קלט ואת הקובץ עצמו.

סוגי התמונות הנתמכים כקלט להסקת מסקנות במכשיר הם PNG ו-JPEG.

// Imports + initialization of FirebaseApp and backend service + creation of model instance

// Converts a File object to a Part object.
async function fileToGenerativePart(file) {
  const base64EncodedDataPromise = new Promise((resolve) => {
    const reader = new FileReader();
    reader.onloadend = () => resolve(reader.result.split(',')[1]);
    reader.readAsDataURL(file);
  });
  return {
    inlineData: { data: await base64EncodedDataPromise, mimeType: file.type },
  };
}

async function run() {
  // Provide a text prompt to include with the image
  const prompt = "Write a poem about this picture:";

  const fileInputEl = document.querySelector("input[type=file]");
  const imagePart = await fileToGenerativePart(fileInputEl.files[0]);

  // To generate text output, call `generateContent` with the text and image
  const result = await model.generateContent([prompt, imagePart]);

  const response = result.response;
  const text = response.text();
  console.log(text);
}

run();

שימו לב ש-Firebase AI Logic תומך גם בסטרימינג של תשובות טקסט באמצעות generateContentStream (במקום generateContent).

מה עוד אפשר לעשות?

בנוסף לדוגמאות שלמעלה, אתם יכולים גם לאפשר למשתמשי הקצה לנסות את התכונה, להשתמש במצבי הסקה חלופיים, לבטל את מודל ברירת המחדל לגיבוי ולהשתמש בהגדרת המודל כדי לשלוט בתגובות.

איך מאפשרים למשתמשי קצה לנסות את התכונה

כדי לאפשר למשתמשי הקצה לנסות את התכונה, אתם יכולים להירשם לניסויי המקור של Chrome. שימו לב שגרסאות הניסיון האלה מוגבלות בזמן ובשימוש.

נרשמים לגרסת המקור לניסיון של Prompt API ב-Chrome. יינתן לכם טוקן.
צריך לספק את האסימון בכל דף אינטרנט שרוצים להפעיל בו את תכונת הניסיון. אפשר לבחור באחת מהאפשרויות הבאות:
- מעבירים את הטוקן כמטא תג בתג <head>: <meta http-equiv="origin-trial" content="TOKEN">
- מעבירים את הטוקן ככותרת HTTP: Origin-Trial: TOKEN
- מספקים את הטוקן באמצעות תוכנה.

שימוש במצבי הסקה חלופיים

בדוגמאות שלמעלה נעשה שימוש במצב PREFER_ON_DEVICE כדי להגדיר את ה-SDK כך שישתמש במודל במכשיר אם הוא זמין, או שיחזור למודל שמתארח בענן. ערכת ה-SDK מציעה שלוש שיטות חלופיות להסקת מסקנות: ONLY_ON_DEVICE,‏ ONLY_IN_CLOUD ו-PREFER_IN_CLOUD.

משתמשים במצב ONLY_ON_DEVICE כדי ש-SDK יוכל להשתמש רק במודל במכשיר. במקרה כזה, ה-API יחזיר שגיאה אם מודל במכשיר לא יהיה זמין.
```
const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_ON_DEVICE });
```
משתמשים במצב ONLY_IN_CLOUD כדי ש-SDK יוכל להשתמש רק במודל שמתארח בענן.
```
const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_IN_CLOUD });
```
משתמשים במצב PREFER_IN_CLOUD כדי שה-SDK ינסה להשתמש במודל שמארח בענן, אבל אם המודל הזה לא יהיה זמין (לדוגמה, אם המכשיר לא מחובר לאינטרנט), הוא יחזור למודל שבמכשיר.
```
const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_IN_CLOUD });
```

שינוי מודל ברירת המחדל לגיבוי

מודל ברירת המחדל שמתארח בענן הוא gemini-2.0-flash-lite.

המודל הזה הוא מודל חלופי שמתארח בענן כשמשתמשים במצב PREFER_ON_DEVICE. זה גם המודל שמוגדר כברירת מחדל כשמשתמשים במצב ONLY_IN_CLOUD או במצב PREFER_IN_CLOUD.

אפשר להשתמש באפשרות ההגדרה inCloudParams כדי לציין מודל חלופי שמתארח בענן כברירת מחדל.

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  inCloudParams: {
    model: "GEMINI_MODEL_NAME"
  }
});

שמות המודלים הנתמכים של Gemini

שימוש בהגדרות המודל כדי לשלוט בתשובות

בכל בקשה למודל, אפשר לשלוח הגדרת מודל כדי לשלוט באופן שבו המודל יוצר תשובה. מודלים שמתארחים בענן ומודלים במכשיר מציעים אפשרויות הגדרה שונות.

ההגדרה נשמרת למשך כל חיי המופע. אם רוצים להשתמש בהגדרה אחרת, צריך ליצור מופע GenerativeModel חדש עם ההגדרה הזו.

הגדרת מודל שמתארח בענן

משתמשים באפשרות inCloudParams כדי להגדיר מודל Gemini שמתארח בענן. מידע על הפרמטרים הזמינים

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  inCloudParams: {
    model: "GEMINI_MODEL_NAME"
    temperature: 0.8,
    topK: 10
  }
});

הגדרת מודל במכשיר

הערה: כדי להסיק מסקנות באמצעות מודל במכשיר, צריך להשתמש ב-Prompt API מ-Chrome.

משתמשים באפשרות onDeviceParams כדי להגדיר מודל במכשיר. מידע על הפרמטרים הזמינים

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  onDeviceParams: {
    createOptions: {
      temperature: 0.8,
      topK: 8
    }
  }
});

הגדרת הפלט המובנה (כמו JSON)

אפשר ליצור פלט מובנה (כמו JSON ו-enums) להסקת מסקנות באמצעות מודלים שמתארחים בענן ומודלים שפועלים במכשיר.

כדי להגדיר את המודל כך שיגיב עם פלט מובנה, משתמשים ב-inCloudParams וב-onDeviceParams. במצבים האחרים, משתמשים רק בתצורה הרלוונטית.

במאפיין inCloudParams: מציינים את responseMimeType המתאים (בדוגמה הזו, application/json) ואת responseSchema שרוצים שהמודל ישתמש בו.
במקרה של onDeviceParams: מציינים את responseConstraint שרוצים שהמודל ישתמש בו.

פלט JSON

בדוגמה הבאה מותאמת דוגמה כללית לפלט JSON להסקת מסקנות היברידית:

import {
  getAI,
  getGenerativeModel,
  Schema
} from "firebase/ai";

const jsonSchema = Schema.object({
 properties: {
    characters: Schema.array({
      items: Schema.object({
        properties: {
          name: Schema.string(),
          accessory: Schema.string(),
          age: Schema.number(),
          species: Schema.string(),
        },
        optionalProperties: ["accessory"],
      }),
    }),
  }
});

const model = getGenerativeModel(ai, {
  mode: InferenceMode.INFERENCE_MODE,
  inCloudParams: {
    model: "gemini-2.5-flash"
    generationConfig: {
      responseMimeType: "application/json",
      responseSchema: jsonSchema
    },
  }
  onDeviceParams: {
    promptOptions: {
      responseConstraint: jsonSchema
    }
  }
});

פלט של טיפוסים בני מנייה (enum)

כמו בדוגמה שלמעלה, אבל עם התאמה של התיעוד בנושא פלט enum להסקת מסקנות היברידית:

// ...

const enumSchema = Schema.enumString({
  enum: ["drama", "comedy", "documentary"],
});

const model = getGenerativeModel(ai, {

// ...

    generationConfig: {
      responseMimeType: "text/x.enum",
      responseSchema: enumSchema
    },

// ...
});

// ...

תכונות שעדיין לא זמינות להסקת מסקנות במכשיר

בגרסת הניסוי הזו, לא כל היכולות של Web SDK זמינות להסקת מסקנות במכשיר. התכונות הבאות עדיין לא נתמכות בהסקת מסקנות במכשיר (אבל הן בדרך כלל זמינות להסקת מסקנות מבוססת-ענן).

יצירת טקסט מקבצים של תמונות בפורמטים שונים מ-JPEG ו-PNG
- אפשר לחזור למודל שמתארח בענן, אבל מצב ONLY_ON_DEVICE יחזיר שגיאה.
יצירת טקסט מקלט שמע, סרטונים ומסמכים (כמו קובצי PDF)
- אפשר לחזור למודל שמתארח בענן, אבל מצב ONLY_ON_DEVICE יחזיר שגיאה.
יצירת תמונות באמצעות מודלים של Gemini או Imagen
- אפשר לחזור למודל שמתארח בענן, אבל מצב ONLY_ON_DEVICE יחזיר שגיאה.
העברת קבצים באמצעות כתובות URL בבקשות מולטימודאליות. צריך לספק קבצים כנתונים מוטבעים למודלים במכשיר.
שיחה עם זיכרון
- אפשר לחזור למודל שמתארח בענן, אבל מצב ONLY_ON_DEVICE יחזיר שגיאה.
שידור דו-כיווני עם Gemini Live API
המודל מקבל כלים שיעזרו לו ליצור את התשובה (כמו קריאה לפונקציה, הרצת קוד וביסוס על חיפוש Google)
ספירת טוקנים
- תמיד מחזירה שגיאה. המספר יהיה שונה בין מודלים שמארחים בענן לבין מודלים שפועלים במכשיר, ולכן אין מעבר אינטואיטיבי למודל חלופי.
מעקב אחרי AI במסוף Firebase להסקת מסקנות במכשיר.
- שימו לב שאפשר לעקוב אחרי כל מסקנה שמתקבלת באמצעות המודלים שמארחים בענן, בדיוק כמו אחרי מסקנות אחרות שמתקבלות באמצעות Firebase AI Logic client SDK for Web.

רוצה לתת משוב על חוויית השימוש ב-Firebase AI Logic?