Le azioni di Alibaba Group sono aumentate vertiginosamente dopo il rilascio di QwQ-32B, un nuovo modello di ragionamento AI open source. Il modello rivaleggia con DeepSeek-R1 in termini di prestazioni, ma è significativamente più piccolo, con 32,5 miliardi di parametri rispetto ai 671 miliardi di R1 (anche se R1 ne attiva solo 37 miliardi alla volta). QwQ-32B, basato sull'architettura Transformer, incorpora la codifica posizionale rotativa per una migliore comprensione del testo. Può elaborare prompt con un massimo di 131.072 token ed eccelle nella codifica, nella matematica e nelle attività applicative esterne. Sviluppato utilizzando l'apprendimento per rinforzo, QwQ-32B ha superato R1 nei benchmark che misurano l'interazione del sistema esterno, la risposta alle domande e l'allineamento dell'output. Questo rilascio segue l'impegno di Alibaba a investire 53 miliardi di dollari in infrastrutture AI nei prossimi tre anni. Anche altri giganti tecnologici cinesi come Tencent stanno dando la priorità allo sviluppo di LLM, evidenziando la crescente corsa all'IA in Cina.
Alibaba presenta QwQ-32B, un nuovo modello AI open source che rivaleggia con DeepSeek-R1
Modificato da: Ольга Паничкина
Leggi altre notizie su questo argomento:
Hai trovato un errore o un'inaccuratezza?
Esamineremo il tuo commento il prima possibile.