تمت ترجمة هذه الصفحة بواسطة Cloud Translation API‏.

تحليل المستندات (مثل ملفات PDF) باستخدام واجهة برمجة التطبيقات Gemini

يمكنك أن تطلب من نموذج Gemini تحليل ملفات المستندات (مثل ملفات PDF وملفات النصوص العادية) التي تقدّمها إما مضمّنة (بترميز base64) أو من خلال عنوان URL. عند استخدام Firebase AI Logic، يمكنك تقديم هذا الطلب مباشرةً من تطبيقك.

باستخدام هذه الميزة، يمكنك تنفيذ إجراءات، مثل:

تحليل المخططات البيانية والرسومات البيانية والجداول داخل المستندات
استخراج المعلومات إلى تنسيقات نتائج منظَّمة
الإجابة عن أسئلة حول المحتوى المرئي والنصوص في المستندات
تلخيص المستندات
تحويل محتوى المستند إلى نص (مثلاً إلى HTML) مع الحفاظ على التنسيقات و التنسيقات، وذلك لاستخدامها في التطبيقات النهائية (مثل قنوات RAG)

الانتقال إلى عيّنات الرموز البرمجية الانتقال إلى الرمز البرمجي للاستجابات التي يتم بثّها

الاطّلاع على أدلة أخرى للحصول على خيارات إضافية للعمل مع المستندات (مثل ملفات PDF)
إنشاء إخراج منظَّم المحادثة المتعدّدة المقاطع

قبل البدء

انقر على مزوّد Gemini API لعرض المحتوى الخاص بالمزوّد والرمز البرمجي في هذه الصفحة.

إذا لم يسبق لك ذلك، أكمِل قراءة دليل البدء الذي يوضّح كيفية إعداد مشروعك على Firebase وربط تطبيقك بـ Firebase وإضافة حزمة تطوير البرامج (SDK) وبدء خدمة الخلفية لمزوّد Gemini API الذي اخترته، وإنشاء مثيل GenerativeModel.

لاختبار طلباتك وتكرارها وحتى الحصول على مقتطف رمز تم إنشاؤه، ننصحك باستخدام Google AI Studio.

هل تحتاج إلى نموذج ملف PDF؟

يمكنك استخدام هذا الملف المتاح للجميع بنوع MIME‏ application/pdf (عرض الملف أو تنزيله). https://storage.googleapis.com/cloud-samples-data/generative-ai/pdf/2403.05530.pdf

إنشاء نص من ملفات PDF (مُشفَّرة بترميز base64)

قبل تجربة هذا العيّنة، عليك إكمال القسم قبل البدء من هذا الدليل لإعداد مشروعك وتطبيقك.
في هذا القسم، عليك أيضًا النقر على زر Gemini API مقدّم الخدمة الذي اخترته حتى يظهر لك المحتوى الخاص بالمقدّم في هذه الصفحة.

يمكنك أن تطلب من نموذج Gemini إنشاء نص من خلال تقديم نص وملفات PDF، مع توفير mimeType لكل ملف إدخال والملف نفسه. يمكنك الاطّلاع على المتطلبات والاقتراحات المتعلّقة بملفات الإدخال لاحقًا في هذه الصفحة.