L'entreprise technologique chinoise Alibaba a lancé Wan 2.1, la dernière version de son modèle d'intelligence artificielle dédié à la création d'images et de vidéos, désormais disponible en open source. Avec cette initiative, Alibaba vise à démocratiser l'accès aux technologies avancées d'IA et à encourager l'innovation au sein de la communauté mondiale des développeurs.
Wan 2.1 est capable de générer des images et des vidéos de haute qualité à partir de descriptions textuelles ou graphiques. Le modèle prend en charge le chinois et l'anglais, ce qui le rend accessible à un large public. Selon Alibaba, Wan 2.1 figure parmi les meilleurs modèles du classement VBench, qui évalue les performances des modèles de génération vidéo en fonction de la dynamique du mouvement, des relations spatiales et des interactions entre objets.
Alibaba a mis à disposition quatre versions de Wan 2.1 avec différentes tailles de paramètres – 14 milliards et 1,3 milliard. Ces modèles sont disponibles en téléchargement sur ModelScope et Hugging Face, permettant ainsi aux chercheurs, institutions académiques et entreprises de les intégrer à leurs projets.
Avec la publication de Wan 2.1, Alibaba réaffirme son engagement en faveur de la transparence et de la collaboration dans le domaine de l'intelligence artificielle, en fournissant des outils puissants pour la création de contenus visuels de haute qualité et en stimulant l'innovation technologique.