Llama4 系列模型发布

要点
- 混合专家架构,原生支持多模态
- 发布
Llama 4 Scout和Llama 4 Maverick两款原生多模态大模型 - 支持 1000 万 Token 上下文,开辟了无限可能,包括多文档总结、解析大量用户活动以执行个性化任务以及在庞大的代码库上进行推理
- Llama 4 Scout 有 17B 活跃参数,配备了 16 位专家,是同类中最好的多模态模型。可以完全嵌入到一个 NVIDIA H100 GPU 中运行
- Llama 4 Maverick 同样有 17B 个活跃参数,
但拥有 128 位专家。它在广泛的基准测试中超越了 GPT-4o 和 Gemini 2.0 Flash,并且在推理能力和编程等任务上与 DeepSeek v3 相比仅需不到一半的活跃参数就能达到相似的表现 - Llama 4 Scout 和 Llama 4 Maverick 都是从 Llama 4 Behemoth 蒸馏而来,Llama 4 Behemoth 有 288B 参数,还在训练中,拥有 16 位专家,是目前最强大的模型之一,在多个 STEM 基准测试上超越了 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro






