অ্যালগরিদম যখন ভিডিওতে ঘটনার গতিপ্রকৃতি সম্পর্কে 'ভবিষ্যদ্বাণী' করতে শুরু করে, তখন ব্যবহারকারীরা অনিচ্ছাসত্ত্বেও একে ভবিষ্যতের জানালা হিসেবে বিশ্বাস করতে শুরু করেন। তবে নতুন 'ওয়ার্ল্ডরিজনবেঞ্চ' (WorldReasonBench) মানদণ্ডটি দেখিয়ে দিচ্ছে যে, ভিডিওর বাহ্যিক বিশ্বাসযোগ্যতার আড়ালে প্রায়শই কার্যকারণ সম্পর্কের গভীরতার অভাব থাকে।
ওয়ার্ল্ডরিজনবেঞ্চ হলো মানুষের বিভিন্ন অভিজ্ঞতার এমন এক সংকলন, যেখানে মডেলগুলোকে কেবল বিশ্বাসযোগ্য দৃশ্য তৈরি করলেই হবে না, বরং পৃথিবীর অভ্যন্তরীণ যুক্তি—যেমন মাধ্যাকর্ষণ, বস্তুর আচরণ এবং সামাজিক মিথস্ক্রিয়া—বজায় রাখতে হবে। আগের পরীক্ষাগুলো যেখানে মূলত দৃশ্যগত মান বা ভিজ্যুয়াল কোয়ালিটির ওপর জোর দিত, সেখানে বর্তমান পরীক্ষাটি পারিপার্শ্বিক অবস্থার পূর্বাভাস দেওয়ার ক্ষেত্রে এআই-এর সক্ষমতার ওপর আলোকপাত করছে।
গবেষকরা লক্ষ্য করেছেন যে, বর্তমানের বেশিরভাগ ভিডিও জেনারেটর সহজ ফিজিক্যাল অ্যাকশনগুলো সামলাতে পারলেও দৃশ্য জটিল হওয়ার সাথে সাথে খেই হারিয়ে ফেলে। টেবিল থেকে পড়ে যাওয়া একটি কাপ যদি কোনো দৃশ্যমান কারণ ছাড়াই হঠাৎ তার গতিপথ বদলে ফেলে, তবে একজন মানুষ সহজেই তা ধরে ফেলতে পারেন; কিন্তু মডেলটি এই অসঙ্গতিকে উপেক্ষা করেই দৃশ্যগুলো তৈরি করে যেতে থাকে।
এ ধরনের সীমাবদ্ধতা সরাসরি আমাদের দৈনন্দিন জীবনে প্রভাব ফেলে। ট্রাফিক পরিস্থিতি সিমুলেশন, চিকিৎসা পদ্ধতি বা শিক্ষামূলক ভিডিওর ক্ষেত্রে যদি ভিডিও-এআই ব্যবহার করা হয়, তবে জগতের স্বাভাবিক নিয়মের ভুলগুলো ভুল প্রত্যাশা এবং ভ্রান্ত সিদ্ধান্তের কারণ হতে পারে। যে ব্যক্তি এআই দ্বারা তৈরি ভিডিওর ওপর নির্ভর করছেন, তিনি এই বিভ্রমকে সঠিক পূর্বাভাস হিসেবে গ্রহণ করার ঝুঁকির মুখে পড়তে পারেন।
সম্ভবত প্রধান সমস্যাটি হলো মডেলগুলোর মধ্যে একটি শক্তিশালী 'ওয়ার্ল্ড মডেল' বা জগত সম্পর্কে ধারণার অভাব—অর্থাৎ সময়ের সাথে সাথে বস্তু এবং মানুষ কীভাবে আচরণ করে সে সম্পর্কে তাদের কোনো অভ্যন্তরীণ উপস্থাপনা নেই। ওয়ার্ল্ডরিজনবেঞ্চ মূলত ডেভেলপারদের ছবির সৌন্দর্যের পরিবর্তে এই গভীর যৌক্তিক সামঞ্জস্য পরিমাপ করতে বাধ্য করছে।
এর ফলে, এই বেঞ্চমার্কটি প্রযুক্তি শিল্পকে আরও নির্ভরযোগ্য টুল তৈরির দিকে ধাবিত করছে, যেখানে চাক্ষুষ আকর্ষণের চেয়ে যাচাইযোগ্য পূর্বাভাস দেওয়ার সক্ষমতা বেশি গুরুত্ব পাচ্ছে। এটি অগ্রগতির মূল্যায়নের মানদণ্ডকেও বদলে দিচ্ছে: এখন কেবল 'দেখতে বাস্তবসম্মত' হওয়াটাই যথেষ্ট নয়, বরং 'যৌক্তিক ধারাবাহিতা বজায় রাখা'ও সমান গুরুত্বপূর্ণ।
পরিশেষে, এ ধরণের পরীক্ষাগুলো আমাদের এমন সব ক্ষেত্রে ভিডিও-এআই ব্যবহারের বিষয়ে আরও সচেতন হতে সাহায্য করে, যেখানে সঠিক পূর্বাভাসের ওপর বাস্তব জীবনের গুরুত্বপূর্ণ সিদ্ধান্ত নির্ভর করে।



