মাস্ক পরিহিত পরিবেশে উন্নত স্পিচ রিকগনিশনের জন্য ওয়েভলেট বিশ্লেষণ এবং COPRAS
ওয়েভলেট বিশ্লেষণ হল স্পিচ এবং অ্যাকোস্টিক সংকেত বিশ্লেষণের জন্য একটি শক্তিশালী সরঞ্জাম, বিশেষ করে যখন মাস্কের মতো কারণগুলির দ্বারা স্পিচ বোধগম্যতা আপোস করা হয়। কোভিড-১৯ মহামারী স্পষ্ট যোগাযোগের জন্য মাস্কের কারণে সৃষ্ট চ্যালেঞ্জগুলো তুলে ধরেছে। ওয়েভলেট ট্রান্সফর্ম (WT) সময় এবং ফ্রিকোয়েন্সি ডোমেন ডেটা একত্রিত করে স্পিচ রিকগনিশন উন্নত করার মাধ্যমে একটি সমাধান প্রস্তাব করে।
কার্যকর WT-এর জন্য একটি উপযুক্ত "মাদার ওয়েভলেট" নির্বাচন করা অত্যন্ত গুরুত্বপূর্ণ, কারণ বিভিন্ন ওয়েভলেট বিভিন্ন ফলাফল দেয়। গবেষণা COPRAS (COmplex PRoportional ASsessment) কৌশল ব্যবহার করে ফেস মাস্ক বা শিল্ড ব্যবহার করার সময় স্পিচ সংকেতের জন্য সর্বোত্তম মাদার ওয়েভলেট ফাংশন নির্ধারণ করতে।
সর্বোচ্চ ক্রস-কোরিলেশন কোফিসিয়েন্ট (MCC) এবং সর্বোচ্চ শক্তি থেকে শ্যানন অনুপাত (MEER) এর মতো মেট্রিকগুলি মাদার ওয়েভলেট ফাংশনগুলিকে স্থান দিতে ব্যবহৃত হয়। এই পদ্ধতিটি বিভিন্ন, বাস্তব-বিশ্বের পরিস্থিতিতে স্পিচ সংকেতের জন্য সবচেয়ে উপযুক্ত মাদার ওয়েভলেটগুলি নির্বাচন করার জন্য একটি স্পষ্ট প্রোটোকল স্থাপন করে যেখানে মাস্ক থাকতে পারে। ওয়েভলেট ট্রান্সফর্মগুলি নির্দিষ্ট রূপান্তরের জন্য অপরিবর্তনীয় বৈশিষ্ট্যগুলি বের করে প্যাটার্ন স্বীকৃতি সিস্টেমগুলিকে উন্নত করে এবং গোলমালযুক্ত পরিবেশে ক্লাসিফায়ারগুলির কার্যকারিতা উন্নত করতে পারে।