মাউন্টেন ভিউ, ক্যালিফোর্নিয়া - Google DeepMind স্ব-নিয়ন্ত্রিত রোবটগুলির জন্য ডিজাইন করা একটি উন্নত এআই মডেল, Gemini Robotics উন্মোচন করেছে।
Gemini Robotics রোবটগুলিকে ক্লাউডের উপর নির্ভরতা ছাড়াই কাজ করতে সক্ষম করে, দ্রুততর, আরও নির্ভরযোগ্য সিস্টেমের জন্য অন-ডিভাইস প্রক্রিয়াকরণ ব্যবহার করে। মডেলটি Gemini 2.0 এর উপর ভিত্তি করে তৈরি করা হয়েছে এবং এতে ভিশন-ল্যাঙ্গুয়েজ-অ্যাকশন (VLA) ক্ষমতা অন্তর্ভুক্ত রয়েছে।
মূল বৈশিষ্ট্যগুলির মধ্যে রয়েছে:
নেটওয়ার্ক বিলম্বতা দূর করতে অন-ডিভাইস প্রক্রিয়াকরণ।
স্বল্প-শট লার্নিং, যা 50-100টি প্রদর্শনের মাধ্যমে অভিযোজনকে অনুমতি দেয়।
বিভিন্ন রোবটের সাথে অভিযোজনযোগ্যতা, যার মধ্যে ALOHA, Franka FR3 এবং Apollo অন্তর্ভুক্ত।
Google একটি নির্বাচিত প্রোগ্রামের মাধ্যমে Gemini Robotics SDK প্রকাশ করেছে। এই পদক্ষেপটি তার প্রতিযোগিতামূলক সুবিধা রক্ষার দিকে একটি কৌশলগত পরিবর্তনকে তুলে ধরে। শিল্প রোবট স্থাপনার বিশ্ব বাজার 16.5 বিলিয়ন ডলারে পৌঁছেছে, যেখানে “ফিজিক্যাল এআই” একটি মূল প্রবণতা।
মডেলটির জেনারেটিভ ক্ষমতা সাধারণ কমান্ডের বাইরে বিস্তৃত, যা রোবটগুলিকে নতুন কাজ করতে সক্ষম করে। এটি Google-কে পরবর্তী প্রজন্মের বুদ্ধিমান মেশিন তৈরির প্রতিযোগিতামূলক দৃশ্যে স্থান দেয়।