SambaNova behaalt recordsnelheid met DeepSeek-R1 AI-modelimplementatie

19:39, 20 februari

Bewerkt door: Veronika Nazarova

SambaNova Systems heeft de snelste implementatie ter wereld aangekondigd van het DeepSeek-R1 671B grote taalmodel. Het bedrijf behaalde 198 tokens per seconde per gebruiker met slechts 16 op maat gemaakte chips, ter vervanging van de 40 racks met 320 Nvidia GPU's die normaal vereist zijn. Volgens SambaNova maakt hun SN40L RDU-chip hun platform het snelst voor het uitvoeren van DeepSeek. Ze verwachten de snelheid te verhogen tot vijf keer sneller dan de nieuwste GPU-snelheid op één rack en tegen het einde van het jaar 100 keer de capaciteit voor DeepSeek-R1 te bieden. De herconfigureerbare dataflow-architectuur van SambaNova biedt een efficiëntere oplossing, met drie keer de snelheid en vijf keer de efficiëntie van toonaangevende GPU's. DeepSeek-R1 is nu beschikbaar op SambaNova Cloud, met API-toegang aangeboden aan geselecteerde gebruikers.

Lees meer nieuws over dit onderwerp:

17 mei

Anthropic Secures $2.5 Billion Credit Line Amid AI Competition

17 mei

US and UAE Reach Agreement on Nvidia AI Chip Exports in 2025

17 mei

Openai Unveils Codex: Advanced Ai Coding Agent for Software Development

Heb je een fout of onnauwkeurigheid gevonden?

We zullen je opmerkingen zo snel mogelijk in overweging nemen.