अलीबाबा ने डीपसीक-आर1 को टक्कर देने वाला नया ओपन-सोर्स एआई मॉडल क्यूडब्ल्यूक्यू-32बी पेश किया

द्वारा संपादित: Ольга Паничкина

अलीबाबा ग्रुप के शेयर क्यूडब्ल्यूक्यू-32बी जारी करने के बाद बढ़ गए, जो एक नया ओपन-सोर्स एआई तर्क मॉडल है। यह मॉडल प्रदर्शन में डीपसीक-आर1 को टक्कर देता है लेकिन काफी छोटा है, आर1 के 671 बिलियन की तुलना में 32.5 बिलियन पैरामीटर हैं (हालांकि आर1 एक समय में केवल 37 बिलियन को सक्रिय करता है)। ट्रांसफॉर्मर आर्किटेक्चर पर आधारित क्यूडब्ल्यूक्यू-32बी में बेहतर टेक्स्ट समझ के लिए रोटरी पोजिशनल एन्कोडिंग शामिल है। यह 131,072 टोकन तक के संकेतों को संसाधित कर सकता है और कोडिंग, गणित और बाहरी एप्लिकेशन कार्यों में उत्कृष्ट है। रीइन्फोर्समेंट लर्निंग का उपयोग करके विकसित, क्यूडब्ल्यूक्यू-32बी ने बाहरी सिस्टम इंटरैक्शन, प्रश्न-उत्तर और आउटपुट संरेखण को मापने वाले बेंचमार्क में आर1 को बेहतर प्रदर्शन किया। यह रिलीज अगले तीन वर्षों में एआई इंफ्रास्ट्रक्चर में 53 बिलियन डॉलर का निवेश करने की अलीबाबा की प्रतिबद्धता के बाद हुई है। टेनसेंट जैसे अन्य चीनी तकनीकी दिग्गज भी एलएलएम विकास को प्राथमिकता दे रहे हैं, जो चीन में बढ़ती एआई दौड़ को उजागर करता है।

क्या आपने कोई गलती या अशुद्धि पाई?

हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।