تمت ترجمة هذه الصفحة بواسطة Cloud Translation API‏.

تحليل ملفات الفيديو باستخدام Gemini API

يمكنك أن تطلب من نموذج Gemini تحليل ملفات الفيديو التي تقدّمها إما بشكل مضمّن (بتشفير base64) أو من خلال عنوان URL. عند استخدام Firebase AI Logic، يمكنك تقديم هذا الطلب مباشرةً من تطبيقك.

باستخدام هذه الإمكانية، يمكنك تنفيذ إجراءات مثل:

إضافة ترجمة وشرح والإجابة عن أسئلة حول الفيديوهات
تحليل مقاطع معيّنة من فيديو باستخدام الطوابع الزمنية
تحويل محتوى الفيديو إلى نص من خلال معالجة المقطع الصوتي والإطارات المرئية
وصف الفيديوهات وتقسيمها واستخراج المعلومات منها، بما في ذلك المقطع الصوتي والإطارات المرئية

الانتقال إلى عيّنات التعليمات البرمجية الانتقال إلى التعليمات البرمجية للاستجابات المتدفّقة

الاطّلاع على أدلة أخرى تتضمّن خيارات إضافية للتعامل مع الفيديو
إنشاء ناتج منظَّم محادثة متعدّدة الجولات

قبل البدء

انقر على مزوّد Gemini API لعرض المحتوى والرمز الخاصين بالمزوّد على هذه الصفحة.

إذا لم يسبق لك إجراء ذلك، أكمل دليل بدء الاستخدام الذي يوضّح كيفية إعداد مشروعك على Firebase وربط تطبيقك بـ Firebase وإضافة حزمة تطوير البرامج (SDK) وتهيئة خدمة الخلفية لمقدّم خدمة Gemini API الذي اخترته وإنشاء مثيل GenerativeModel.

لاختبار طلباتك وتكرارها، وحتى للحصول على مقتطف رمز برمجي من إنشاء الذكاء الاصطناعي، ننصحك باستخدام Google AI Studio.

هل تحتاج إلى ملف فيديو نموذجي؟

يمكنك استخدام هذا الملف المتاح للجميع بنوع MIME‏ video/mp4 (عرض الملف أو تنزيله). https://storage.googleapis.com/cloud-samples-data/video/animals.mp4

إنشاء نص من ملفات الفيديو (بتشفير base64)

قبل تجربة هذا النموذج، أكمل القسم قبل البدء من هذا الدليل لإعداد مشروعك وتطبيقك.
في هذا القسم، ستنقر أيضًا على زر لمقدّم الخدمة الذي اخترته Gemini API حتى يظهر لك محتوى خاص بمقدّم الخدمة في هذه الصفحة.

يمكنك أن تطلب من نموذج Gemini إنشاء نص من خلال تقديم نص وفيديو، مع توفير mimeType لكل ملف إدخال والملف نفسه. يمكنك الاطّلاع على المتطلبات والاقتراحات المتعلقة بملفات الإدخال لاحقًا في هذه الصفحة.

يُرجى العِلم أنّ هذا المثال يعرض كيفية توفير الملف مضمّنًا، ولكن حِزم SDK تتيح أيضًا توفير عنوان URL على YouTube.