চ্যাটজিপিটি মডেলগুলি মানুষের ভাষার ফ্র্যাক্টাল প্রকৃতি প্রকাশ করে

06:35, 26 ফেব্রুয়ারি

সম্পাদনা করেছেন: Vera Mo

গত ছয় দশক ধরে, গণনামূলক ভাষাবিজ্ঞানীরা ভাষা মডেল করার জন্য বিভিন্ন পদ্ধতি অনুসন্ধান করেছেন, সম্প্রতি চ্যাটজিপিটি-র মতো বৃহৎ ভাষা মডেল (এলএলএম) ব্যবহার করে সম্ভাব্য উত্তর খুঁজে পেয়েছেন। প্রাথমিক পদ্ধতিগুলি নোয়াম চমস্কির আনুষ্ঠানিক ব্যাকরণ এবং অনমনীয় শব্দার্থবিদ্যা ব্যবহার করত, যা অর্থের তরল প্রকৃতির সাথে সংগ্রাম করত। 1990-এর দশকে, এন-গ্রামের উপর ভিত্তি করে পরিসংখ্যানগত মডেল চালু করা হয়েছিল, যা শব্দগুলির সহ-অস্তিত্বের সম্ভাবনার মাধ্যমে ভাষার বর্ণনা দেয়। উদাহরণস্বরূপ, "io vedo" [আমি দেখি] "io casa" [আমি বাড়ি] এর চেয়ে বেশি ঘন ঘন ঘটে। এই মডেলগুলি ভাষাগত বিশ্লেষণকে স্বয়ংক্রিয় করেছে, কিন্তু অর্থকে শব্দ সান্নিধ্যে কমিয়ে দিয়েছে। ট্রান্সফরমার নেটওয়ার্কের উপর ভিত্তি করে এলএলএম-এর আবির্ভাব একটি বিপ্লব চিহ্নিত করেছে। এলএলএম একটি বাক্যে পরবর্তী শব্দটি ভবিষ্যদ্বাণী করে শেখে, একটি প্রক্রিয়া যা পুরো ওয়েব টেক্সটে পুনরাবৃত্তি হয়। এটি তাদের শব্দ ভবিষ্যদ্বাণী করতে এবং পাঠ্য ধারাবাহিকতা তৈরি করতে সক্ষম করে। এলএলএম শব্দ ফ্রিকোয়েন্সিগুলির বৃহৎ আকারের পরিসংখ্যানগত বিশ্লেষণকে সহজতর করেছে, ভাষার ফ্র্যাক্টাল প্রকৃতি প্রকাশ করেছে। ফ্র্যাক্টালের মতো, ভাষা বিভিন্ন স্কেলে স্ব-সদৃশতা প্রদর্শন করে, যেখানে সংহতি শব্দের, বাক্য এবং সম্পূর্ণ পাঠ্যে প্রদর্শিত হয়। দীর্ঘ-পরিসরের সম্পর্ক দূরবর্তী শব্দ বা অনুচ্ছেদগুলিকে অর্থপূর্ণভাবে সংযুক্ত করে। এলএলএম স্থানীয় তথ্যকে সাধারণীকরণ এবং মাইকেল পোলানি দ্বারা সংজ্ঞায়িত অভিজ্ঞতা অর্জনের মাধ্যমে অর্জিত নীরব জ্ঞান মডেল করার ক্ষমতার কারণে সফল। ভাষাবিজ্ঞানীরা এখন মানুষের ভাষাকে একটি বিশৃঙ্খল, জটিল ঘটনা হিসাবে স্বীকৃতি দেন, এলএলএম এর জটিলতা অধ্যয়নের জন্য সরঞ্জাম হিসাবে কাজ করে।

এই বিষয়ে আরও খবর পড়ুন:

17 মে

Cádiz University unveils Phoenician history games for kids

17 মে

Ie-cor lexical database: Moscow school's methodology and error analysis

16 মে

Bilingualism: Cognitive benefits, academic performance, and educational distinctions

আপনি কি কোনো ত্রুটি বা অসঠিকতা খুঁজে পেয়েছেন?

আমরা আপনার মন্তব্য যত তাড়াতাড়ি সম্ভব বিবেচনা করব।