Alibaba presenta QwQ-32B, un nuovo modello AI open source che rivaleggia con DeepSeek-R1

20:38, 06 marzo

Modificato da: Ольга Паничкина

Le azioni di Alibaba Group sono aumentate vertiginosamente dopo il rilascio di QwQ-32B, un nuovo modello di ragionamento AI open source. Il modello rivaleggia con DeepSeek-R1 in termini di prestazioni, ma è significativamente più piccolo, con 32,5 miliardi di parametri rispetto ai 671 miliardi di R1 (anche se R1 ne attiva solo 37 miliardi alla volta). QwQ-32B, basato sull'architettura Transformer, incorpora la codifica posizionale rotativa per una migliore comprensione del testo. Può elaborare prompt con un massimo di 131.072 token ed eccelle nella codifica, nella matematica e nelle attività applicative esterne. Sviluppato utilizzando l'apprendimento per rinforzo, QwQ-32B ha superato R1 nei benchmark che misurano l'interazione del sistema esterno, la risposta alle domande e l'allineamento dell'output. Questo rilascio segue l'impegno di Alibaba a investire 53 miliardi di dollari in infrastrutture AI nei prossimi tre anni. Anche altri giganti tecnologici cinesi come Tencent stanno dando la priorità allo sviluppo di LLM, evidenziando la crescente corsa all'IA in Cina.

Leggi altre notizie su questo argomento:

21 luglio

Il Regno Unito accelera sull'intelligenza artificiale con investimenti significativi

21 luglio

OpenAI's AI Model Achieves Gold Medal-Level Performance at International Mathematical Olympiad 2025

21 luglio

OpenAI Annuncia GPT-5: Un Nuovo Capitolo nell'Intelligenza Artificiale

Hai trovato un errore o un'inaccuratezza?

Esamineremo il tuo commento il prima possibile.