Alibaba Luncurkan QwQ-32B, Model AI Sumber Terbuka Baru yang Menyaingi DeepSeek-R1

Diedit oleh: Ольга Паничкина

Saham Alibaba Group melonjak setelah merilis QwQ-32B, model penalaran AI sumber terbuka baru. Model ini menyaingi DeepSeek-R1 dalam kinerja tetapi secara signifikan lebih kecil, dengan 32,5 miliar parameter dibandingkan dengan 671 miliar R1 (meskipun R1 hanya mengaktifkan 37 miliar pada satu waktu). QwQ-32B, berdasarkan arsitektur Transformer, menggabungkan pengkodean posisi rotari untuk pemahaman teks yang lebih baik. Ia dapat memproses perintah dengan hingga 131.072 token dan unggul dalam pengkodean, matematika, dan tugas aplikasi eksternal. Dikembangkan menggunakan pembelajaran penguatan, QwQ-32B mengungguli R1 dalam tolok ukur yang mengukur interaksi sistem eksternal, menjawab pertanyaan, dan penyelarasan keluaran. Rilis ini mengikuti komitmen Alibaba untuk menginvestasikan $53 miliar dalam infrastruktur AI selama tiga tahun ke depan. Raksasa teknologi Tiongkok lainnya seperti Tencent juga memprioritaskan pengembangan LLM, menyoroti perlombaan AI yang berkembang di Tiongkok.

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.