تمت ترجمة هذه الصفحة بواسطة Cloud Translation API‏.

تحليل ملفات الفيديو باستخدام Gemini API

يمكنك أن تطلب من نموذج Gemini تحليل ملفات الفيديو التي تقدّمها، سواء كانت مضمّنة (بترميز base64) أو من خلال عنوان URL. عند استخدام Firebase AI Logic، يمكنك تقديم هذا الطلب مباشرةً من تطبيقك.

باستخدام هذه الميزة، يمكنك تنفيذ إجراءات، مثل:

إضافة ترجمة وشرح للفيديوهات والإجابة عن أسئلة بشأنها
تحليل مقاطع معيّنة من الفيديو باستخدام الطوابع الزمنية
تحويل محتوى الفيديو إلى نص من خلال معالجة كلّ من المقطع الصوتي والإطارات المرئية
وصف الفيديوهات وتقسيمها واستخراج المعلومات منها، بما في ذلك المقطع الصوتي والصور

الانتقال إلى عيّنات الرموز البرمجية الانتقال إلى الرمز البرمجي للاستجابات التي يتم بثّها

الاطّلاع على أدلة أخرى للحصول على خيارات إضافية للعمل مع الفيديو
إنشاء إخراج منظَّم محادثة متعددة المقاطع

قبل البدء

انقر على مزوّد Gemini API لعرض المحتوى الخاص بالمزوّد والرمز البرمجي في هذه الصفحة.

إذا لم يسبق لك ذلك، أكمِل قراءة دليل البدء الذي يوضّح كيفية إعداد مشروعك على Firebase وربط تطبيقك بـ Firebase وإضافة حزمة تطوير البرامج (SDK) وبدء خدمة الخلفية لمزوّد Gemini API الذي اخترته، وإنشاء مثيل GenerativeModel.

لاختبار طلباتك وتكرارها وحتى الحصول على مقتطف رمز تم إنشاؤه، ننصحك باستخدام Google AI Studio.

هل تحتاج إلى نموذج ملف فيديو؟

يمكنك استخدام هذا الملف المتاح للجميع بنوع MIME‏ video/mp4 (عرض الملف أو تنزيله). https://storage.googleapis.com/cloud-samples-data/video/animals.mp4

إنشاء نص من ملفات الفيديو (مشفَّرة بترميز base64)

قبل تجربة هذا العيّنة، عليك إكمال القسم قبل البدء من هذا الدليل لإعداد مشروعك وتطبيقك.
في هذا القسم، عليك أيضًا النقر على زر Gemini API مقدّم الخدمة الذي اخترته حتى يظهر لك المحتوى الخاص بالمقدّم في هذه الصفحة.

يمكنك أن تطلب من نموذج Gemini إنشاء نص من خلال تقديم نص وفيديو، مع توفير mimeType لكل ملف input وملء ملف input نفسه. يمكنك الاطّلاع على المتطلبات والاقتراحات المتعلّقة بملفات الإدخال لاحقًا في هذه الصفحة.

يُرجى العِلم أنّ هذا المثال يعرض تقديم الملف مضمّنًا، ولكن حزم SDK تتيح أيضًا تقديم عنوان URL لفيديو على YouTube.