Meta推出了Llama 4系列,该系列包含能够理解文本、图像和视频的先进多模态AI模型。该系列包括Llama 4 Scout,以其1000万token上下文窗口的文档摘要功能而闻名;以及Llama 4 Maverick,专为使用4000亿参数的复杂任务而设计。
Llama 4模型采用原生多模态设计,结合早期融合技术,将文本和视觉token无缝集成到统一的模型主干中。
Llama 4 Maverick包含170亿个活跃参数、128个专家和4000亿个总参数,与Llama 3.3 70B相比,以更低的价格提供更高的质量。Llama 4 Maverick是同类最佳的多模态模型,在编码、推理、多语言、长上下文和图像基准测试中,超越了GPT-4o和Gemini 2.0等同类模型,并且在编码和推理方面与更大的DeepSeek v3.1具有竞争力。
Meta正在将Llama 4集成到WhatsApp、Messenger和Instagram的Meta AI中。然而,由于欧盟AI法案周围的监管不确定性,位于欧盟的开发者和公司被限制使用多模态模型。此限制不适用于最终用户。每月用户超过7亿的公司需要获得Meta的明确批准才能使用Llama 4。