2025年4月8日,英伟达推出Llama3.1Nemotron Ultra253B,这一基于Llama-3.1-405B优化的开源模型以253亿参数超越Meta的Llama4Behemoth和Maverick,成为AI领域焦点。

该模型在GPQA-Diamond、AIME2024/25及LiveCodeBench等测试中表现卓越,推理吞吐量达DeepSeek R1的四倍。通过优化训练和算法,英伟达证明高效设计可让小模型媲美巨型对手。

英伟达发布Llama 3.1 Nemotron Ultra 253B:性能超群的技术新标杆

Llama3.1Nemotron Ultra253B通过HuggingFace开放权重,并采用商业友好许可。英伟达此举不仅便利开发者,也推动了AI技术的广泛应用和生态发展。

以较小参数挑战万亿级模型,该模型展现“少即是多”的理念,或将促使业界反思参数竞赛,探索更可持续的AI路径。

英伟达发布Llama 3.1 Nemotron Ultra 253B:性能超群的技术新标杆

其高性能和灵活性适用于代码生成、科学研究等领域。随着开发者深入使用,这一模型有望在2025年引发更大变革。

对于开发者而言,这一模型提供了高性能、低门槛的实验平台;对于企业而言,其商业许可和高效特性则意味着更低的部署成本和更广泛的应用场景。从代码生成到科学研究,再到自然语言处理,这一模型的多功能性有望在多个领域引发变革。

地址:https://huggingface.co/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1