Deepseek VL-2: Neues KI-Modell balanciert Leistung und Effizienz

15:24, 15 Februar

Bearbeitet von: Veronika Radoslavskaya

Deepseek, China, hat VL-2 auf den Markt gebracht, ein KI-Modell für Bild- und Sprachverarbeitung, das Leistung und Effizienz ausbalanciert. VL-2 basiert auf einer Mixture-of-Experts (MoE)-Architektur und aktiviert nur die für bestimmte Aufgaben notwendigen Subnetzwerke, wodurch die Ressourcennutzung optimiert wird. Das VL-2 Small-Modell steht auf Hugging Face zum Testen zur Verfügung. Dieses Modell zeichnet sich durch Aufgaben wie die Umwandlung von Flussdiagrammen in Code, die Analyse von Lebensmittelbildern und das Verständnis von visuellem Humor aus. Sein MoE-Design unterteilt das Modell in spezialisierte Subnetzwerke, wodurch der Rechenaufwand reduziert und gleichzeitig die Genauigkeit erhalten bleibt. Die VL-2 Tiny-Variante verwendet 1 Milliarde Parameter während der Inferenz, während die Small- und Large-Varianten 2,8 Milliarden bzw. 4,5 Milliarden verwenden. Deepseek VL-2 ist nützlich in den Bereichen Gesundheitswesen, Bildung und Datenanalyse und bietet Lösungen für reale Herausforderungen wie die Automatisierung von Arbeitsabläufen und die Verbesserung der Benutzererfahrung.

Weitere Nachrichten zu diesem Thema lesen:

14 Juli

Kimi K2: Ein Durchbruch für KI-gestützte Programmierung und autonome Aufgaben

11 Juni

Meta stellt V-JEPA 2 vor: Ein neues KI-Weltmodell zum Verständnis der physischen Welt

10 Juni

Afrikas InkubaLM KI-Modell um 75 % für Effizienz komprimiert

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.