Alibaba ra mắt QwQ-32B, một mô hình AI mã nguồn mở mới cạnh tranh với DeepSeek-R1

Chỉnh sửa bởi: Ольга Паничкина

Cổ phiếu của Alibaba Group đã tăng vọt sau khi phát hành QwQ-32B, một mô hình suy luận AI mã nguồn mở mới. Mô hình này cạnh tranh với DeepSeek-R1 về hiệu suất nhưng nhỏ hơn đáng kể, với 32,5 tỷ tham số so với 671 tỷ của R1 (mặc dù R1 chỉ kích hoạt 37 tỷ tại một thời điểm). QwQ-32B, dựa trên kiến trúc Transformer, kết hợp mã hóa vị trí quay để hiểu văn bản tốt hơn. Nó có thể xử lý các lời nhắc với tối đa 131.072 mã thông báo và vượt trội trong mã hóa, toán học và các tác vụ ứng dụng bên ngoài. Được phát triển bằng cách sử dụng học tăng cường, QwQ-32B đã vượt trội hơn R1 trong các điểm chuẩn đo lường tương tác hệ thống bên ngoài, trả lời câu hỏi và căn chỉnh đầu ra. Bản phát hành này theo sau cam kết của Alibaba sẽ đầu tư 53 tỷ đô la vào cơ sở hạ tầng AI trong ba năm tới. Các gã khổng lồ công nghệ Trung Quốc khác như Tencent cũng đang ưu tiên phát triển LLM, làm nổi bật cuộc đua AI ngày càng tăng ở Trung Quốc.

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.