अलीबाबा ग्रुप के शेयर क्यूडब्ल्यूक्यू-32बी जारी करने के बाद बढ़ गए, जो एक नया ओपन-सोर्स एआई तर्क मॉडल है। यह मॉडल प्रदर्शन में डीपसीक-आर1 को टक्कर देता है लेकिन काफी छोटा है, आर1 के 671 बिलियन की तुलना में 32.5 बिलियन पैरामीटर हैं (हालांकि आर1 एक समय में केवल 37 बिलियन को सक्रिय करता है)। ट्रांसफॉर्मर आर्किटेक्चर पर आधारित क्यूडब्ल्यूक्यू-32बी में बेहतर टेक्स्ट समझ के लिए रोटरी पोजिशनल एन्कोडिंग शामिल है। यह 131,072 टोकन तक के संकेतों को संसाधित कर सकता है और कोडिंग, गणित और बाहरी एप्लिकेशन कार्यों में उत्कृष्ट है। रीइन्फोर्समेंट लर्निंग का उपयोग करके विकसित, क्यूडब्ल्यूक्यू-32बी ने बाहरी सिस्टम इंटरैक्शन, प्रश्न-उत्तर और आउटपुट संरेखण को मापने वाले बेंचमार्क में आर1 को बेहतर प्रदर्शन किया। यह रिलीज अगले तीन वर्षों में एआई इंफ्रास्ट्रक्चर में 53 बिलियन डॉलर का निवेश करने की अलीबाबा की प्रतिबद्धता के बाद हुई है। टेनसेंट जैसे अन्य चीनी तकनीकी दिग्गज भी एलएलएम विकास को प्राथमिकता दे रहे हैं, जो चीन में बढ़ती एआई दौड़ को उजागर करता है।
अलीबाबा ने डीपसीक-आर1 को टक्कर देने वाला नया ओपन-सोर्स एआई मॉडल क्यूडब्ल्यूक्यू-32बी पेश किया
द्वारा संपादित: Ольга Паничкина
इस विषय पर और अधिक समाचार पढ़ें:
क्या आपने कोई गलती या अशुद्धि पाई?
हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।