英伟达惊开源新模型！性能直逼DeepSeek-R1，4倍推理吞吐量超震撼！

张绍荣 2025-04-09 减肥 56 次浏览 0个评论

英伟达开源新模型

今日，英伟达开源了名为Llama-3.1-Nemotron-Ultra-253B-v1的新模型。它基于Meta早期模型开发，有2530亿参数，在多项测试中表现出色。英伟达新模型性能逼近DeepSeek R1，参数量不到其一半。测试结果显示，在GPQA、IFEval指令遵循和LiveCodeBench编码任务中表现优异，推理吞吐量比DeepSeek R1高4倍。不过在部分基准测试中，DeepSeek R1仍略占优势。

技术特点与应用场景

Llama-3.1-Nemotron-Ultra-253B采用神经架构搜索优化架构等技术。其代码已公开，可用于聊天机器人开发等场景，还获准商业用途。Llama-3.1-Nemotron-Ultra-253B的体验地址为https://build.nvidia.com/nvidia/llama-3_1-nemotron-ultra-253b-v1?ncid=so-twit-273200。

转载请注明来自灵通资讯网，本文标题：《英伟达惊开源新模型！性能直逼DeepSeek-R1，4倍推理吞吐量超震撼！》

张绍荣 650篇文章站点微博

每一天，每一秒，你所做的决定都会改变你的人生！