মোবাইল এবং ওয়েব অ্যাপের জন্য, Firebase AI লজিক SDK গুলি আপনাকে সরাসরি আপনার অ্যাপ থেকে সমর্থিত জেমিনি মডেল এবং Imagen 3 মডেলের সাথে ইন্টারঅ্যাক্ট করতে দেয়।
জেমিনি মডেলগুলিকে মাল্টিমোডাল হিসাবে বিবেচনা করা হয় কারণ তারা পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও এবং অডিও সহ একাধিক পদ্ধতি প্রক্রিয়াকরণ এবং এমনকি তৈরি করতে সক্ষম। ইমেজেন 3 মডেলগুলিকে ইমেজ তৈরি করতে পাঠ্যের সাথে অনুরোধ করা যেতে পারে।
নিম্নলিখিত টেবিলটি Firebase AI লজিকের জন্য সমর্থিত মডেলগুলির একটি সংক্ষিপ্ত বিবরণ এবং তাদের সর্বশেষ স্থিতিশীল মডেলের নাম। এই টেবিলটি প্রিভিউ এবং পরীক্ষামূলক মডেলগুলিও তালিকাভুক্ত করে যা প্রোটোটাইপিং ব্যবহারের ক্ষেত্রে উপলব্ধ।
মডেল | ইনপুট | আউটপুট | বর্ণনা |
---|---|---|---|
স্থিতিশীল সংস্করণ সহ মিথুন মডেল | |||
Gemini 2.0 Flashgemini-2.0-flash-001 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON (ছবি এবং অডিও শীঘ্রই আসছে!) | উচ্চতর গতি, অন্তর্নির্মিত টুল ব্যবহার এবং একটি 1M টোকেন প্রসঙ্গ উইন্ডো সহ পরবর্তী-জেনার বৈশিষ্ট্য এবং উন্নত ক্ষমতা সহ আমাদের মাল্টিমোডাল মডেল (মাল্টিমোডাল প্রজন্ম শীঘ্রই আসছে!) |
Gemini 2.0 Flash-Litegemini-2.0-flash-lite-001 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের দ্রুততম এবং সবচেয়ে সাশ্রয়ী ফ্ল্যাশ মডেল। এটি 1.5 ফ্ল্যাশ ব্যবহারকারীদের জন্য একটি আপগ্রেড পাথ যারা একই দাম এবং গতিতে আরও ভাল মানের চান৷ |
শুধুমাত্র পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ সহ জেমিনি মডেল (শুধুমাত্র প্রোটোটাইপ ব্যবহারের ক্ষেত্রে প্রস্তাবিত) | |||
Gemini 2.5 Progemini-2.5-pro-preview-05-06 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের সবচেয়ে উন্নত যুক্তি মডেল, জটিল সমস্যা সমাধান করতে সক্ষম. |
মিথুন 2.5 ফ্ল্যাশgemini-2.5-flash-preview-04-17 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আমাদের চিন্তার মডেল যা দুর্দান্ত, ভাল বৃত্তাকার ক্ষমতা প্রদান করে। এটি মূল্য এবং কর্মক্ষমতার মধ্যে ভারসাম্য অফার করার জন্য ডিজাইন করা হয়েছে। |
Gemini 2.0 Flash-Live 1gemini-2.0-flash-live-preview-04-09 | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | পাঠ্য (স্ট্রিমিং), অডিও (স্ট্রিমিং) | আমাদের মাল্টিমোডাল মডেল যা মাল্টিমোডাল ইনপুট এবং আউটপুটগুলির স্বল্প-বিলম্বিত রিয়েলটাইম স্ট্রিমিং সমর্থন করে। |
ইমেজ 3 মডেল ( ফায়ারবেস এআই লজিক ব্যবহার করার সময়) | |||
চিত্র 3imagen-3.0-generate-002 | পাঠ্য | ছবি | প্রাকৃতিক ভাষার পাঠ্য প্রম্পট থেকে বাস্তবসম্মত, উচ্চ-মানের ছবি তৈরি করে |
চিত্র 3 দ্রুত 2imagen-3.0-fast-generate-001 | পাঠ্য | ছবি | প্রোটোটাইপিং বা কম লেটেন্সি ব্যবহারের ক্ষেত্রে ছবি তৈরি করে |
1 Firebase AI লজিক SDK-এর সাথে Gemini Developer API ব্যবহার করার সময় সমর্থিত নয়।
2 আপনি যেভাবে API অ্যাক্সেস করেন না কেন জেমিনি ডেভেলপার API দ্বারা সমর্থিত নয়৷
এছাড়াও, Firebase AI লজিক সমর্থন করে এবং সমর্থন করে না এমন সমস্ত মডেল সম্পর্কে আমাদের FAQ পর্যালোচনা করুন।
এই পৃষ্ঠার অবশিষ্টাংশ Firebase AI লজিক দ্বারা সমর্থিত মডেলগুলি সম্পর্কে বিস্তারিত তথ্য প্রদান করে।
- সমর্থিত ইনপুট এবং আউটপুট
- সমর্থিত ক্ষমতার উচ্চ-স্তরের তুলনা
- স্পেসিফিকেশন এবং সীমাবদ্ধতা, উদাহরণস্বরূপ সর্বোচ্চ ইনপুট টোকেন বা ইনপুট ভিডিওর সর্বোচ্চ দৈর্ঘ্য
মডেলগুলি কীভাবে সংস্করণ করা হয় তার বিবরণ, বিশেষত তাদের স্থিতিশীল , স্বয়ংক্রিয় আপডেট হওয়া , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণ
আরম্ভ করার সময় আপনার কোডে অন্তর্ভুক্ত করার জন্য উপলব্ধ মডেল নামের তালিকা
মডেলের জন্য সমর্থিত ভাষার তালিকা
এই পৃষ্ঠার নীচে, আপনি পুরানো মডেল সম্পর্কে বিস্তারিত তথ্য দেখতে পারেন।
মডেল তুলনা করুন
বিভিন্ন ব্যবহারের ক্ষেত্রে সমর্থন করার জন্য প্রতিটি মডেলের বিভিন্ন ক্ষমতা রয়েছে। লক্ষ্য করুন যে এই বিভাগের প্রতিটি টেবিল প্রতিটি মডেলকে বর্ণনা করে যখন Firebase AI লজিক ব্যবহার করা হয় । প্রতিটি মডেলের অতিরিক্ত ক্ষমতা থাকতে পারে যা আমাদের SDK ব্যবহার করার সময় পাওয়া যায় না।
আপনি যদি নিম্নলিখিত উপ-বিভাগগুলিতে যে তথ্য খুঁজছেন তা খুঁজে না পান, আপনি আপনার নির্বাচিত API প্রদানকারী ডকুমেন্টেশনে আরও তথ্য পেতে পারেন:
জেমিনি ডেভেলপার এপিআই : জেমিনি মডেল এবং ইমেজেন মডেল
Vertex AI Gemini API : জেমিনি মডেল এবং ইমেজেন মডেল
সমর্থিত ইনপুট এবং আউটপুট
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি সমর্থিত ইনপুট এবং আউটপুট প্রকার:
মিথুন 2.5 প্রো | মিথুন 2.5 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ছবি 3 / ছবি 3 দ্রুত | |||
---|---|---|---|---|---|---|---|---|
ইনপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
নথিপত্র (পিডিএফ বা প্লেইন-টেক্সট) | ||||||||
ছবি | ||||||||
ভিডিও | ||||||||
অডিও | ||||||||
অডিও (স্ট্রিমিং) | ||||||||
আউটপুট প্রকার | ||||||||
পাঠ্য | ||||||||
পাঠ্য (স্ট্রিমিং) | ||||||||
কোড | ||||||||
স্ট্রাকচার্ড আউটপুট (JSON এর মত) | ||||||||
ছবি | শীঘ্রই আসছে! | |||||||
অডিও | শীঘ্রই আসছে! | |||||||
অডিও (স্ট্রিমিং) |
সমর্থিত ফাইল প্রকার সম্পর্কে জানতে, সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তা দেখুন।
সমর্থিত ক্ষমতা এবং বৈশিষ্ট্য
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি সমর্থিত ক্ষমতা এবং বৈশিষ্ট্যগুলি:
মিথুন 2.5 প্রো | মিথুন 2.5 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ছবি 3 / ছবি 3 দ্রুত | |
---|---|---|---|---|---|---|
শুধুমাত্র পাঠ্য বা মাল্টিমোডাল ইনপুট থেকে পাঠ্য তৈরি করুন | শুধুমাত্র স্ট্রিমিং | |||||
ছবি তৈরি করুন ( চিত্র 3 ) | শীঘ্রই আসছে! | |||||
অডিও জেনারেট করুন | শীঘ্রই আসছে! | শুধুমাত্র স্ট্রিমিং | ||||
কাঠামোগত আউটপুট তৈরি করুন (JSON এর মত) | ||||||
নথি বিশ্লেষণ করুন (পিডিএফ বা প্লেইন-টেক্সট) | ||||||
চিত্র বিশ্লেষণ করুন (দৃষ্টি) | ||||||
ভিডিও বিশ্লেষণ করুন (দৃষ্টি) | ||||||
অডিও বিশ্লেষণ করুন | শুধুমাত্র স্ট্রিমিং | |||||
বহু পালা চ্যাট | ||||||
ফাংশন কলিং (সরঞ্জাম) | ||||||
টোকেন গণনা করুন | ||||||
সিস্টেম নির্দেশাবলী | ||||||
দ্বিমুখী মাল্টিমডাল স্ট্রিমিং |
স্পেসিফিকেশন এবং সীমাবদ্ধতা
ফায়ারবেস এআই লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি নির্দিষ্টকরণ এবং সীমাবদ্ধতাগুলি:
সম্পত্তি | মিথুন 2.5 প্রো | মিথুন 2.5 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ | মিথুন 2.0 ফ্ল্যাশ- লাইট | মিথুন 2.0 ফ্ল্যাশ- লাইভ | ছবি 3 / ছবি 3 দ্রুত | |
---|---|---|---|---|---|---|---|
প্রসঙ্গ উইন্ডো * মোট টোকেন সীমা (সম্মিলিত ইনপুট+আউটপুট) | 1,048,576 টোকেন | 1,048,576 টোকেন | 1,048,576 টোকেন | 1,048,576 টোকেন | 32,768 টোকেন | 480 টোকেন | |
আউটপুট টোকেন সীমা * | 65,536 টোকেন | 65,536 টোকেন | 8,192 টোকেন | 8,192 টোকেন | --- | --- | |
জ্ঞান কাটঅফ তারিখ | জানুয়ারী 2025 | জানুয়ারী 2025 | জুন 2024 | জুন 2024 | আগস্ট 2024 | --- | |
পিডিএফ (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট পিডিএফ ফাইল ** | 3,000 ফাইল | 3,000 ফাইল | 3,000 ফাইল | 3,000 ফাইল | --- | --- | |
সর্বোচ্চ সংখ্যা পৃষ্ঠাগুলির প্রতি ইনপুট পিডিএফ ফাইল ** | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | --- | --- | |
সর্বোচ্চ আকার প্রতি ইনপুট পিডিএফ ফাইল | 50 এমবি | 50 এমবি | 50 এমবি | 50 এমবি | --- | --- | |
ছবি (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট ইমেজ | 3,000 ছবি | 3,000 ছবি | 3,000 ছবি | 3,000 ছবি | --- | --- | |
সর্বোচ্চ সংখ্যা আউটপুট ইমেজ | --- | --- | শীঘ্রই আসছে! | --- | --- | 4টি ছবি | |
সর্বোচ্চ আকার প্রতি ইনপুট base64-এনকোডেড চিত্র | 7 এমবি | 7 এমবি | 7 এমবি | 7 এমবি | --- | --- | |
ভিডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট ভিডিও ফাইলের | 10টি ফাইল | 10টি ফাইল | 10টি ফাইল | 10টি ফাইল | --- | --- | |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (শুধুমাত্র ফ্রেম) | ~60 মিনিট | ~60 মিনিট | ~60 মিনিট | ~60 মিনিট | --- | --- | |
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (ফ্রেম + অডিও) | ~45 মিনিট | ~45 মিনিট | ~45 মিনিট | ~45 মিনিট | --- | --- | |
অডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট অডিও ফাইলের | 1 ফাইল | 1 ফাইল | 1 ফাইল | 1 ফাইল | --- | --- | |
সর্বোচ্চ সংখ্যা আউটপুট অডিও ফাইলের | --- | --- | শীঘ্রই আসছে! | --- | --- | --- | |
সর্বোচ্চ দৈর্ঘ্য সব ইনপুট অডিও | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | ~8.4 ঘন্টা | --- | --- | |
সর্বোচ্চ দৈর্ঘ্য সমস্ত আউটপুট অডিও | --- | --- | শীঘ্রই আসছে! | --- | --- | --- |
* সমস্ত মিথুন মডেলের জন্য, একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য, তাই 100টি টোকেন প্রায় 60-80টি ইংরেজি শব্দ। মিথুন মডেলের জন্য, আপনি countTokens
ব্যবহার করে আপনার অনুরোধে মোট টোকেনের সংখ্যা নির্ধারণ করতে পারেন।
** পিডিএফগুলিকে চিত্র হিসাবে বিবেচনা করা হয়, তাই একটি পিডিএফের একক পৃষ্ঠাকে একটি চিত্র হিসাবে বিবেচনা করা হয়। একটি অনুরোধে অনুমোদিত পৃষ্ঠার সংখ্যা মডেলটি সমর্থন করতে পারে এমন চিত্রগুলির সংখ্যার মধ্যে সীমাবদ্ধ।
অতিরিক্ত বিস্তারিত তথ্য খুঁজুন
প্রতিটি মডেলের জন্য কোটা এবং মূল্য আলাদা। দাম ইনপুট এবং আউটপুট উপর নির্ভর করে.
সমর্থিত ইনপুট ফাইলের ধরন সম্পর্কে জানুন, কীভাবে MIME প্রকার নির্দিষ্ট করবেন এবং কীভাবে নিশ্চিত করবেন যে আপনার ইনপুট ফাইল এবং মাল্টিমোডাল অনুরোধগুলি প্রয়োজনীয়তাগুলি পূরণ করে এবং সমর্থিত ইনপুট ফাইল এবং প্রয়োজনীয়তাগুলিতে সর্বোত্তম অনুশীলনগুলি অনুসরণ করে।
মডেল সংস্করণ এবং নামকরণের ধরণ
মডেলগুলি স্থিতিশীল , পূর্বরূপ এবং পরীক্ষামূলক সংস্করণে দেওয়া হয়। সুবিধার জন্য, স্পষ্ট সংস্করণ মান ছাড়া উপনাম সমর্থিত।
আপনার কোডে ব্যবহার করার জন্য নির্দিষ্ট মডেলের নাম খুঁজতে, এই পৃষ্ঠায় পরে "উপলভ্য মডেলের নাম" বিভাগটি দেখুন।
সংস্করণ প্রকার / মুক্তির মঞ্চ | বর্ণনা | মডেল নামের প্যাটার্ন | |
---|---|---|---|
স্থিতিশীল | স্থিতিশীল সংস্করণগুলি উপলব্ধ এবং প্রকাশের তারিখ থেকে উত্পাদন ব্যবহারের জন্য সমর্থিত। একটি স্থিতিশীল মডেল সংস্করণ সাধারণত অবসর গ্রহণের তারিখের সাথে প্রকাশ করা হয়, যা শেষ দিনটি নির্দেশ করে যে মডেলটি উপলব্ধ। এই তারিখের পরে, মডেলটি আর অ্যাক্সেসযোগ্য বা Google দ্বারা সমর্থিত নয়৷ | স্থিতিশীল সংস্করণগুলির মডেল নামগুলি একটি নির্দিষ্ট তিন-সংখ্যার সংস্করণ নম্বরের সাথে যুক্ত করা হয় উদাহরণ: | |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম | স্বতঃ-আপডেট করা স্থিতিশীল উপনামগুলি সর্বদা সেই মডেলের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে৷ যদি একটি নতুন স্থিতিশীল সংস্করণ প্রকাশিত হয়, স্বয়ংক্রিয়ভাবে আপডেট হওয়া উপনাম স্বয়ংক্রিয়ভাবে সেই নতুন স্থিতিশীল সংস্করণের দিকে নির্দেশ করা শুরু করে। | উপনামের মডেল নামের কোন উপাঙ্গ নেই উদাহরণ: | |
পূর্বরূপ | পূর্বরূপ সংস্করণে নতুন ক্ষমতা রয়েছে এবং স্থিতিশীল নয় বলে মনে করা হয়। পূর্বরূপ সংস্করণগুলি সর্বদা সেই মডেলের সর্বশেষ পূর্বরূপ সংস্করণের দিকে নির্দেশ করে৷ যদি একটি নতুন প্রিভিউ সংস্করণ প্রকাশিত হয়, তবে বিদ্যমান পূর্বরূপ সংস্করণটি স্বয়ংক্রিয়ভাবে সেই নতুন পূর্বরূপ সংস্করণের দিকে নির্দেশ করতে শুরু করে। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না , আরও সীমাবদ্ধ হারের সীমা সহ আসে এবং বিলিং প্রয়োজনীয়তা থাকতে পারে। | পূর্বরূপ সংস্করণের মডেল নাম এর সাথে যুক্ত করা হয়েছে উদাহরণ: | |
পরীক্ষামূলক | পরীক্ষামূলক সংস্করণে নতুন ক্ষমতা রয়েছে এবং স্থিতিশীল নয় বলে মনে করা হয়। এই মডেলগুলি উত্পাদন ব্যবহারের জন্য সুপারিশ করা হয় না এবং আরও সীমাবদ্ধ হারের সীমা সহ আসে। পরীক্ষামূলক মডেলগুলি প্রতিক্রিয়া সংগ্রহের জন্য এবং আমাদের সাম্প্রতিক বৈশিষ্ট্যগুলির সাথে পরীক্ষা সক্ষম করার উদ্দেশ্যে তৈরি করা হয়েছে৷ | পরীক্ষামূলক সংস্করণের মডেল নাম এর সাথে যুক্ত করা হয়েছে উদাহরণ: | |
অবসরপ্রাপ্ত | অবসরপ্রাপ্ত সংস্করণগুলি তাদের অবসর গ্রহণের তারিখ অতিক্রম করেছে এবং স্থায়ীভাবে নিষ্ক্রিয় করা হয়েছে৷ অবসরপ্রাপ্ত মডেলগুলি আর Google দ্বারা অ্যাক্সেসযোগ্য বা সমর্থিত নয়৷ একটি অবসরপ্রাপ্ত মডেল আইডি উল্লেখ করার অনুরোধগুলি সাধারণত একটি 404 ত্রুটি প্রদান করে। | --- |
উপলব্ধ মডেল নাম
মডেলের নামগুলি হল সুস্পষ্ট মান যা আপনি মডেলের শুরু করার সময় আপনার কোডে অন্তর্ভুক্ত করেন।
প্রোগ্রামগতভাবে সমস্ত উপলব্ধ মডেল তালিকা
আপনি REST API ব্যবহার করে সমস্ত উপলব্ধ মডেলের নাম তালিকাভুক্ত করতে পারেন:
জেমিনি ডেভেলপার API :
models.list
এন্ডপয়েন্টে কল করুনVertex AI Gemini API :
publishers.models.list
এন্ডপয়েন্টে কল করুন
মনে রাখবেন যে এই প্রত্যাবর্তিত তালিকায় API প্রদানকারীদের দ্বারা সমর্থিত সমস্ত মডেল অন্তর্ভুক্ত থাকবে, কিন্তু Firebase AI লজিক শুধুমাত্র এই পৃষ্ঠায় বর্ণিত জেমিনি এবং ইমেজেন মডেলগুলিকে সমর্থন করে৷ এছাড়াও মনে রাখবেন যে স্বয়ংক্রিয়-আপডেট করা উপনামগুলি (উদাহরণস্বরূপ, gemini-2.0-flash
) তালিকাভুক্ত নয় কারণ সেগুলি বেস মডেলের জন্য একটি সুবিধাজনক উপনাম৷
মিথুন মডেলের নাম
আপনার প্ল্যাটফর্মের জন্য প্রাথমিক উদাহরণের জন্য, শুরু করার নির্দেশিকা দেখুন।
প্রকাশের পর্যায়গুলি সম্পর্কে বিশদ বিবরণের জন্য (বিশেষ করে ব্যবহারের ক্ষেত্রে এবং বিলিং এর জন্য), মডেল সংস্করণ এবং নামকরণের ধরণগুলি দেখুন।
Gemini 2.5 Pro মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.5-pro-preview-05-06 | Gemini 2.5 Pro এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-05-06 | নির্ধারণ করা |
gemini-2.5-pro-preview-03-25 | পূর্বরূপ সংস্করণ নির্দেশ করেgemini-2.5-pro-preview-05-06 (যা সর্বশেষ প্রিভিউ সংস্করণ) | পূর্বরূপ | 2025-03-25 | নির্ধারণ করা |
Gemini 2.5 Flash মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.5-flash-preview-04-17 | Gemini 2.5 Flash এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-04-17 | নির্ধারণ করা |
জেমিনি 2.0 ফ্ল্যাশ মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.0-flash-001 | জেমিনি 2.0 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-05 | এর আগে নয় 2026-02-05 |
gemini-2.0-flash | 2.0 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে স্বয়ংক্রিয়-আপডেট করা উপনাম (বর্তমানে gemini-2.0-flash-001 ) | স্থিতিশীল | 2025-02-10 | --- |
Gemini 2.0 Flash-Lite মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.0-flash-lite-001 | Gemini 2.0 Flash-Lite- এর সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-02-25 | এর আগে নয় 2026-02-25 |
gemini-2.0-flash-lite | 2.0 ফ্ল্যাশ-লাইটের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে স্বয়ংক্রিয়-আপডেট করা উপনাম (বর্তমানে gemini-2.0-flash-lite-001 ) | স্থিতিশীল | 2025-02-25 | --- |
Gemini 2.0 Flash-Live মডেলের নাম
আপনার API প্রদানকারী হিসাবে Vertex AI Gemini API ব্যবহার করার সময় শুধুমাত্র উপলব্ধ। |
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 | Gemini 2.0 Flash-Live- এর পূর্বরূপ সংস্করণ | পূর্বরূপ | 2025-04-09 | নির্ধারণ করা |
1 Firebase AI লজিক SDK-এর সাথে Gemini Developer API ব্যবহার করার সময় সমর্থিত নয়।
ইমেজ মডেল নাম
আপনার প্ল্যাটফর্মের জন্য আরম্ভ করার উদাহরণের জন্য, ইমেজেন গাইডের সাহায্যে ছবি তৈরি করুন দেখুন।
প্রকাশের পর্যায়গুলি সম্পর্কে বিশদ বিবরণের জন্য (বিশেষ করে ব্যবহারের ক্ষেত্রে এবং বিলিং এর জন্য), মডেল সংস্করণ এবং নামকরণের ধরণগুলি দেখুন।
ইমেজ 3 মডেল নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-3.0-generate-002 | Imagen 3 এর সর্বশেষ স্থিতিশীল সংস্করণ | স্থিতিশীল | 2025-01-23 | 2026-01-23 এর আগে নয় |
imagen-3.0-generate-001 2 | Imagen 3 এর প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে নয় |
চিত্র 3 দ্রুত মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 | Imagen 3 ফাস্টের প্রাথমিক স্থিতিশীল সংস্করণ | স্থিতিশীল | 2024-07-31 | 2025-07-31 এর আগে নয় |
2 আপনি যেভাবে API অ্যাক্সেস করেন না কেন জেমিনি ডেভেলপার API দ্বারা সমর্থিত নয়৷
সমর্থিত ভাষা
মিথুন
সমস্ত মিথুন মডেল নিম্নলিখিত ভাষায় বুঝতে এবং প্রতিক্রিয়া জানাতে পারে:
আরবি (আরবি), বাংলা (বিএন), বুলগেরিয়ান (বিজি), চাইনিজ সরলীকৃত এবং ঐতিহ্যবাহী (zh), ক্রোয়েশিয়ান (hr), চেক (cs), ডেনিশ (da), ডাচ (nl), ইংরেজি (en), এস্তোনিয়ান (et), ফিনিশ (fi), ফ্রেঞ্চ (fr), জার্মান (de), গ্রীক (el), হিব্রু (iw), হিন্দি (hi), হাঙ্গেরিয়ান (hu), কোরিয়া (hu), কোরিয়া (হু), কোরিয়া (ইন্দো), জাপানি (ইংরেজি) লাটভিয়ান (lv), লিথুয়ানিয়ান (lt), নরওয়েজিয়ান (no), পোলিশ (pl), পর্তুগিজ (pt), রোমানিয়ান (ro), রাশিয়ান (ru), সার্বিয়ান (sr), স্লোভাক (sk), স্লোভেনিয়ান (sl), স্প্যানিশ (es), সোয়াহিলি (sw), সুইডিশ (sv), থাই (th), তুর্কি (tr), ইউক্রেনীয় (ইউক্রেনীয়)
জেমিনি 2.0 ফ্ল্যাশ , জেমিনি 1.5 প্রো এবং জেমিনি 1.5 ফ্ল্যাশ মডেলগুলি নিম্নলিখিত অতিরিক্ত ভাষায় বুঝতে এবং প্রতিক্রিয়া জানাতে পারে:
Afrikaans (af), আমহারিক (am), অসমীয়া (as), আজারবাইজানীয় (az), বেলারুশিয়ান (be), বসনিয়ান (bs), কাতালান (ca), Cebuano (ceb), কর্সিকান (co), ওয়েলশ (cy), দিভেহি (dv), এস্পেরান্তো (eo), বাস্ক (eu), ফার্সি (fa), ফিলিপিনো (তাগালগ (ইউ), ফিলিপিনো (তাগালগ (ইউ), ফিলিপিনো (তাগালগ) (gd), গ্যালিসিয়ান (gl), গুজরাটি (gu), হাউসা (ha), হাওয়াইয়ান (haw), Hmong (hmn), হাইতিয়ান ক্রেওল (ht), আর্মেনিয়ান (hy), ইগবো (ig), আইসল্যান্ডিক (is), জাভানিজ (jv), জর্জিয়ান (ka), কাজাখ (kk), খেমার (km), Kannada (knrnishkriyz), লাকরিও (kn) (kn) (la), লুক্সেমবার্গিশ (lb), লাও (lo), মালাগাসি (mg), মাওরি (mi), ম্যাসেডোনিয়ান (mk), মালায়ালাম (ml), মঙ্গোলিয়ান (mn), Meiteilon (মণিপুরি) (mni-Mtei), মারাঠি (mr), মালয় (ms), মাল্টিজ (mt), মায়ানমার (Burmese), নেপালী (Burmese), নেপালী (mn) ওড়িয়া (ওড়িয়া) (বা), পাঞ্জাবি (পা), পশতু (পিএস), সিন্ধি (এসডি), সিংহলা (সিংহলি) (সি), সামোয়ান (এসএম), শোনা (এসএন), সোমালি (সো), আলবেনিয়ান (বর্গ), সেসোথো (স্ট), সুদানিজ (সু), তামিল (তা), তেলুগু (টে), তাজিক (টিজি), উজুরুকু (উর্দু), উর্দু (উইজিউর) (xh), ইদ্দিশ (yi), ইওরুবা (yo), জুলু (zu)
চিত্র
সাধারণ উপলব্ধতা : ইংরেজি
পূর্বরূপ : চাইনিজ (সরলীকৃত), চাইনিজ (প্রথাগত), হিন্দি, জাপানিজ, কোরিয়ান, পর্তুগিজ, স্প্যানিশ
পুরানো মডেল সম্পর্কে তথ্য
ফায়ারবেস এআই লজিক পুরোনো সক্রিয় জেমিনি মডেলগুলিকে সমর্থন করে (যেমন জেমিনি 1.5 মডেল)।
ফায়ারবেস এআই লজিক পুরানো ইমেজেন মডেলগুলিকে সমর্থন করে না (যেমন ইমেজেন 2 )।
মডেল | ইনপুট | আউটপুট | জন্য অপ্টিমাইজ করা হয়েছে |
---|---|---|---|
মিথুন 1.5 প্রোgemini-1.5-pro-002 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | আরো বুদ্ধিমত্তা প্রয়োজন জটিল যুক্তি কাজ সমর্থন করে; 2M দীর্ঘ প্রসঙ্গ |
মিথুন 1.5 ফ্ল্যাশgemini-1.5-flash-002 | পাঠ্য, কোড, পিডিএফ, ছবি, ভিডিও, অডিও | পাঠ্য, কোড, JSON | বিভিন্ন ধরনের কাজ জুড়ে দ্রুত এবং বহুমুখী কর্মক্ষমতা অফার করে |
gemini-1.0-pro-vision-001 | | | |
gemini-1.0-pro-002 | | | |
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি ইনপুট এবং আউটপুট প্রকার:
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | ||||
---|---|---|---|---|---|---|---|
ইনপুট প্রকার | |||||||
পাঠ্য | |||||||
কোড | |||||||
নথিপত্র (পিডিএফ বা প্লেইন-টেক্সট) | |||||||
ছবি | |||||||
ভিডিও | |||||||
অডিও | |||||||
অডিও (স্ট্রিমিং) | |||||||
আউটপুট প্রকার | |||||||
পাঠ্য | |||||||
কোড | |||||||
স্ট্রাকচার্ড আউটপুট (JSON এর মত) | |||||||
ছবি, ভিডিও এবং অডিও |
Firebase AI লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এই ক্ষমতা এবং বৈশিষ্ট্যগুলি হল:
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | |
---|---|---|---|---|
শুধুমাত্র পাঠ্য ইনপুট থেকে পাঠ্য তৈরি করুন | ||||
মাল্টিমোডাল ইনপুট থেকে পাঠ্য তৈরি করুন | ||||
ছবি তৈরি করুন | ||||
অডিও জেনারেট করুন | ||||
কাঠামোগত আউটপুট তৈরি করুন (JSON এর মত) | ||||
নথি বিশ্লেষণ করুন (পিডিএফ বা প্লেইন-টেক্সট) | ||||
চিত্র বিশ্লেষণ করুন (দৃষ্টি) | ||||
ভিডিও বিশ্লেষণ করুন (দৃষ্টি) | ||||
অডিও বিশ্লেষণ করুন | ||||
বহু পালা চ্যাট | ||||
ফাংশন কলিং (সরঞ্জাম) | ||||
টোকেন এবং বিলযোগ্য অক্ষর গণনা করুন | ||||
সিস্টেম নির্দেশাবলী | ||||
দ্বিমুখী মাল্টিমডাল স্ট্রিমিং |
ফায়ারবেস এআই লজিকের সাথে প্রতিটি মডেল ব্যবহার করার সময় এইগুলি নির্দিষ্টকরণ এবং সীমাবদ্ধতাগুলি:
মিথুন 1.5 প্রো | মিথুন 1.5 ফ্ল্যাশ | জেমিনি 1.0 প্রো ভিশন | জেমিনি 1.0 প্রো | ||||
---|---|---|---|---|---|---|---|
প্রসঙ্গ উইন্ডো * মোট টোকেন সীমা (সম্মিলিত ইনপুট+আউটপুট) | 2,097,152 টোকেন | 1,048,576 টোকেন | 16,384 টোকেন | 32,760 টোকেন | |||
আউটপুট টোকেন সীমা * | 8,192 টোকেন | 8,192 টোকেন | 2,048 টোকেন | 8,192 টোকেন | |||
জ্ঞান কাটঅফ তারিখ | মে 2024 | মে 2024 | ফেব্রুয়ারি 2023 | ফেব্রুয়ারি 2023 | |||
পিডিএফ (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট পিডিএফ ফাইল ** | 3,000 ফাইল | 3,000 ফাইল | 16টি ফাইল | --- | |||
সর্বোচ্চ সংখ্যা প্রতি ইনপুট পিডিএফ ফাইলের পৃষ্ঠাগুলির সংখ্যা ** | 1,000 পৃষ্ঠা | 1,000 পৃষ্ঠা | 16 পৃষ্ঠা | --- | |||
সর্বোচ্চ আকার প্রতি ইনপুট পিডিএফ ফাইল | 50 এমবি | 50 এমবি | 50 এমবি | --- | |||
ছবি (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট ইমেজ | 3,000 ছবি | 3,000 ছবি | 16টি ছবি | --- | |||
সর্বোচ্চ সংখ্যা আউটপুট ইমেজ | --- | --- | --- | --- | |||
সর্বোচ্চ আকার প্রতি ইনপুট base64-এনকোডেড চিত্র | 7 এমবি | 7 এমবি | 7 এমবি | --- | |||
ভিডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট ভিডিও ফাইলের | 10টি ফাইল | 10টি ফাইল | 1 ফাইল | --- | |||
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (শুধুমাত্র ফ্রেম) | ~60 মিনিট | ~60 মিনিট | 2 মিনিট | --- | |||
সর্বোচ্চ দৈর্ঘ্য সমস্ত ইনপুট ভিডিও (ফ্রেম + অডিও) | ~45 মিনিট | ~45 মিনিট | --- | --- | |||
অডিও (প্রতি অনুরোধ) | |||||||
সর্বোচ্চ সংখ্যা ইনপুট অডিও ফাইলের | 1 ফাইল | 1 ফাইল | --- | --- | |||
সর্বোচ্চ সংখ্যা আউটপুট অডিও ফাইলের | --- | --- | --- | --- | |||
সর্বোচ্চ দৈর্ঘ্য সব ইনপুট অডিও | ~8.4 ঘন্টা | ~8.4 ঘন্টা | --- | --- | |||
সর্বোচ্চ দৈর্ঘ্য সব আউটপুট অডিও | --- | --- | --- | --- |
* সমস্ত মিথুন মডেলের জন্য, একটি টোকেন প্রায় 4টি অক্ষরের সমতুল্য, তাই 100টি টোকেন প্রায় 60-80টি ইংরেজি শব্দ। মিথুন মডেলের জন্য, আপনি countTokens
ব্যবহার করে আপনার অনুরোধে মোট টোকেনের সংখ্যা নির্ধারণ করতে পারেন।
** পিডিএফগুলিকে চিত্র হিসাবে বিবেচনা করা হয়, তাই একটি পিডিএফের একক পৃষ্ঠাকে একটি চিত্র হিসাবে বিবেচনা করা হয়। একটি অনুরোধে অনুমোদিত পৃষ্ঠার সংখ্যা মডেলটি সমর্থন করতে পারে এমন চিত্রগুলির সংখ্যার মধ্যে সীমাবদ্ধ।
মডেলের নামগুলি হল সুস্পষ্ট মান যা আপনি মডেলের শুরু করার সময় আপনার কোডে অন্তর্ভুক্ত করেন।
Gemini 1.5 Pro মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.5-pro-002 | জেমিনি 1.5 প্রো এর সর্বশেষ স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 | জেমিনি 1.5 প্রো- এর প্রাথমিক স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-05-24 | 2025-05-24 |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম | ||||
gemini-1.5-pro | 1.5 প্রো এর সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে (বর্তমানে gemini-1.5-pro-002 ) | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
Gemini 1.5 Flash মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.5-flash-002 | জেমিনি 1.5 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 | জেমিনি 1.5 ফ্ল্যাশের প্রাথমিক স্থিতিশীল সংস্করণ | আসন্ন অবসর | 2024-05-24 | 2025-05-24 |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম | ||||
gemini-1.5-flash | 1.5 ফ্ল্যাশের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে৷ (বর্তমানে gemini-1.5-flash-002 ) | আসন্ন অবসর | 2024-09-24 | 2025-09-24 |
জেমিনি 1.0 প্রো ভিশন মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.0-pro-vision-001 | জেমিনি 1.0 প্রো ভিশনের সর্বশেষ স্থিতিশীল সংস্করণ | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম | ||||
gemini-1.0-pro-vision | 1.5 প্রো ভিশনের সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে (বর্তমানে gemini-1.5-pro-vision-001 ) | অবসরপ্রাপ্ত | 2024-01-04 | 2025-04-21 |
Gemini 1.0 Pro মডেলের নাম
মডেলের নাম | বর্ণনা | মুক্তির মঞ্চ | মুক্তির তারিখ | অবসরের তারিখ |
---|---|---|---|---|
স্থিতিশীল সংস্করণ | ||||
gemini-1.0-pro-002 | Gemini 1.0 Pro এর সর্বশেষ স্থিতিশীল সংস্করণ | অবসরপ্রাপ্ত | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 | Gemini 1.0 Pro এর স্থিতিশীল সংস্করণ | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
স্বতঃ-আপডেট করা স্থিতিশীল উপনাম | ||||
gemini-1.0-pro | 1.0 প্রো এর সর্বশেষ স্থিতিশীল সংস্করণের দিকে নির্দেশ করে৷ (বর্তমানে gemini-1.0-pro-002 ) | অবসরপ্রাপ্ত | 2024-02-15 | 2025-04-21 |
পরবর্তী পদক্ষেপ
জেমিনি API- এর ক্ষমতা ব্যবহার করে দেখুন
- মাল্টি-টার্ন কথোপকথন তৈরি করুন (চ্যাট) ।
- শুধুমাত্র পাঠ্য প্রম্পট থেকে পাঠ্য তৈরি করুন।
- ছবি , পিডিএফ , ভিডিও এবং অডিওর মতো বিভিন্ন ধরনের ফাইল প্রম্পট করে পাঠ্য তৈরি করুন।
- টেক্সট এবং মাল্টিমোডাল প্রম্পট উভয় থেকে কাঠামোগত আউটপুট (যেমন JSON) তৈরি করুন।
- টেক্সট প্রম্পট থেকে ছবি তৈরি করুন।
- Gemini Live API ব্যবহার করে স্ট্রিম ইনপুট এবং আউটপুট (অডিও সহ)।
- বাহ্যিক সিস্টেম এবং তথ্যের সাথে জেনারেটিভ মডেল সংযোগ করতে ফাংশন কলিং ব্যবহার করুন।