ट्रॉपिकल प्लांट्स में प्रकाशित हैनान विश्वविद्यालय के एक अभूतपूर्व अध्ययन में पादप जीनोमिक्स में कृत्रिम बुद्धिमत्ता (एआई) के एकीकरण को दर्शाया गया है। शोधकर्ता जटिल आनुवंशिक जानकारी को डिकोड करने के लिए बड़े भाषा मॉडल (एलएलएम) का उपयोग कर रहे हैं। यह दृष्टिकोण कृषि, जैव विविधता संरक्षण और खाद्य सुरक्षा में प्रगति का वादा करता है।
पादप जीनोमिक्स लंबे समय से विशाल और जटिल आनुवंशिक डेटा से जूझ रहा है। पारंपरिक तरीके बड़े डेटासेट और जीनोमिक विविधताओं से जूझते हैं। एलएलएम आनुवंशिक अनुक्रमों और मानव भाषा के बीच समानता का लाभ उठाकर पादप जीनोम का विश्लेषण करने का एक नया तरीका प्रदान करते हैं।
अनुसंधान पादप जीनोम की अनूठी विशेषताओं को समझने के लिए एलएलएम को अनुकूलित करने पर केंद्रित है। व्याकरणिक नियमों वाली मानव भाषाओं के विपरीत, पादप जीनोम जीन अभिव्यक्ति को नियंत्रित करने वाले जैविक नियमों के तहत काम करते हैं। शोधकर्ता पैटर्न को पहचानने और जीन कार्यों की भविष्यवाणी करने के लिए व्यापक पादप जीनोमिक डेटासेट पर एलएलएम को प्रशिक्षित करते हैं।
प्रशिक्षण प्रक्रिया में पूर्व-प्रशिक्षण और फाइन-ट्यूनिंग शामिल है। पूर्व-प्रशिक्षण में समानताएं पहचानने के लिए एलएलएम द्वारा बिना एनोटेशन वाले पादप जीनोमिक डेटा को संसाधित करना शामिल है। फाइन-ट्यूनिंग जैविक कार्यों के लिए मॉडल की भविष्य कहनेवाला क्षमताओं को परिष्कृत करने के लिए एनोटेटेड डेटासेट का उपयोग करता है।
अध्ययन ने पादप जीनोमिक्स के लिए तैयार किए गए विभिन्न एलएलएम आर्किटेक्चर को सफलतापूर्वक लागू किया। इनमें DNABERT जैसे केवल एन्कोडर मॉडल, DNAGPT जैसे केवल डिकोडर मॉडल और ENBED जैसे एन्कोडर-डिकोडर मॉडल शामिल हैं। प्रत्येक मॉडल जीनोमिक डेटा को संभालने में उत्कृष्ट है, जो एन्हांसर और प्रमोटरों की पहचान करने से लेकर जीन अभिव्यक्ति पैटर्न की भविष्यवाणी करने तक है।
एग्रोएनटी और फ्लोराबर्ट जैसे पादप-विशिष्ट मॉडल ने पादप जीनोम को एनोटेट करने में बेहतर प्रदर्शन किया। डीएनए अनुक्रमों की भाषाई विशेषताओं पर ध्यान केंद्रित करके, ये मॉडल जीन विनियमन जटिलताओं को उजागर करते हैं। यह व्यावहारिक कृषि संदर्भों में जीनोमिक जानकारी के अनुप्रयोग को सक्षम बनाता है।
अध्ययन मौजूदा एलएलएम आर्किटेक्चर में कमियों को स्वीकार करता है। वर्तमान मॉडल मुख्य रूप से जानवरों या सूक्ष्मजीव डेटासेट पर प्रशिक्षित हैं, जिनमें पादप प्रजातियों के लिए व्यापक जीनोमिक एनोटेशन का अभाव है। लेखकों ने पादप-केंद्रित एलएलएम की वकालत की है जिसमें विविध जीनोमिक डेटासेट शामिल हैं, विशेष रूप से उष्णकटिबंधीय पौधों जैसी कम अध्ययन वाली प्रजातियों से।
पादप जीनोमिक्स में एआई और एलएलएम फसल सुधार रणनीतियों को गति दे सकते हैं। इससे पौधों की प्रजातियों को बदलती पर्यावरणीय परिस्थितियों के अनुकूल बनाने में मदद मिल सकती है। अंततः, यह जैव विविधता संरक्षण प्रयासों को बढ़ाता है, जो वैश्विक खाद्य सुरक्षा के लिए महत्वपूर्ण है।
यह शोध पादप जीनोमिक्स में एआई की परिवर्तनकारी क्षमता पर प्रकाश डालता है। कम्प्यूटेशनल भाषाविज्ञान और आनुवंशिक विश्लेषण को जोड़कर, शोधकर्ता पादप जीव विज्ञान की हमारी समझ में क्रांति ला सकते हैं। इससे कृषि उत्पादकता बढ़ाने और टिकाऊ प्रथाओं को बढ़ावा देने का वादा किया गया है।
भविष्य के प्रयासों में एलएलएम आर्किटेक्चर को परिष्कृत किया जाएगा और प्रशिक्षण डेटासेट का विस्तार किया जाएगा। इसमें पौधों की प्रजातियों की एक विस्तृत श्रृंखला और वास्तविक दुनिया के कृषि अनुप्रयोगों की जांच शामिल है। यह महत्वपूर्ण अध्ययन पादप जीनोमिक अनुसंधान में एक नए युग की नींव रखता है, जिसमें एआई एक केंद्रीय भूमिका निभा रहा है।