The latest Gemini models, like Gemini 3.1 Flash Image (Nano Banana 2), are available to use with Firebase AI Logic on all platforms!

Gemini 2.0 Flash and Flash-Lite models will be retired on June 1, 2026. To avoid service disruption, update to a newer model like gemini-2.5-flash-lite. Also, Gemini 3 Pro Preview (gemini-3-pro-preview) will be retired on March 9, 2026 (update to Gemini 3.1 Pro Preview: gemini-3.1-pro-preview). Learn more.

این صفحه به‌وسیله ‏Cloud Translation API‏ ترجمه شده است.

اسناد (مانند PDF) را با استفاده از Gemini API تجزیه و تحلیل کنید

شما می‌توانید از یک مدل Gemini بخواهید فایل‌های سند (مانند PDFها و فایل‌های متنی ساده) را که شما به صورت درون‌خطی (با کدگذاری base64) یا از طریق URL ارائه می‌دهید، تجزیه و تحلیل کند. وقتی از Firebase AI Logic استفاده می‌کنید، می‌توانید این درخواست را مستقیماً از برنامه خود انجام دهید.

با این قابلیت، می‌توانید کارهایی مانند موارد زیر را انجام دهید:

نمودارها، جداول و جداول داخل اسناد را تجزیه و تحلیل کنید
استخراج اطلاعات به فرمت‌های خروجی ساختاریافته
پاسخ به سوالات مربوط به محتوای بصری و متنی در اسناد
خلاصه کردن اسناد
رونویسی محتوای سند (برای مثال، به HTML)، با حفظ طرح‌بندی‌ها و قالب‌بندی، برای استفاده در برنامه‌های پایین‌دستی (مانند خطوط لوله RAG)

پرش به نمونه‌های کد پرش به کد برای پاسخ‌های استریم‌شده

برای گزینه‌های بیشتر برای کار با اسناد (مانند PDF) به راهنماهای دیگر مراجعه کنید.
تولید خروجی ساختاریافته چت چند نوبتی

قبل از اینکه شروع کنی

برای مشاهده محتوا و کد مخصوص ارائه‌دهنده در این صفحه، روی ارائه‌دهنده API Gemini خود کلیک کنید.

اگر هنوز این کار را نکرده‌اید، راهنمای شروع به کار را تکمیل کنید، که نحوه راه‌اندازی پروژه Firebase، اتصال برنامه به Firebase، افزودن SDK، راه‌اندازی سرویس backend برای ارائه‌دهنده API انتخابی Gemini و ایجاد یک نمونه GenerativeModel شرح می‌دهد.

برای آزمایش و تکرار روی درخواست‌هایتان، توصیه می‌کنیم از Google AI Studio استفاده کنید.

به نمونه فایل PDF نیاز دارید؟

شما می‌توانید از این فایل عمومی با نوع MIME از application/pdf استفاده کنید ( فایل را مشاهده یا دانلود کنید ). https://storage.googleapis.com/cloud-samples-data/generative-ai/pdf/2403.05530.pdf

تولید متن از فایل‌های PDF (با کدگذاری base64)

قبل از امتحان کردن این نمونه، بخش «قبل از شروع» این راهنما را برای راه‌اندازی پروژه و برنامه خود تکمیل کنید.
در آن بخش، شما همچنین می‌توانید روی دکمه‌ای برای ارائه‌دهنده‌ی API Gemini انتخابی خود کلیک کنید تا محتوای خاص ارائه‌دهنده را در این صفحه مشاهده کنید .

شما می‌توانید از یک مدل Gemini بخواهید با درخواست متن و فایل‌های PDF - با ارائه mimeType هر فایل ورودی و خود فایل - متن تولید کند. الزامات و توصیه‌هایی برای فایل‌های ورودی را بعداً در این صفحه بیابید.