英伟达惊开源新模型!性能直逼DeepSeek-R1,4倍推理吞吐量超震撼!

张绍荣 2025-04-09 减肥 56 次浏览 0个评论

英伟达开源新模型

今日,英伟达开源了名为Llama-3.1-Nemotron-Ultra-253B-v1的新模型。它基于Meta早期模型开发,有2530亿参数,在多项测试中表现出色。英伟达新模型性能逼近DeepSeek R1,参数量不到其一半。测试结果显示,在GPQA、IFEval指令遵循和LiveCodeBench编码任务中表现优异,推理吞吐量比DeepSeek R1高4倍。不过在部分基准测试中,DeepSeek R1仍略占优势。

技术特点与应用场景

Llama-3.1-Nemotron-Ultra-253B采用神经架构搜索优化架构等技术。其代码已公开,可用于聊天机器人开发等场景,还获准商业用途。Llama-3.1-Nemotron-Ultra-253B的体验地址为https://build.nvidia.com/nvidia/llama-3_1-nemotron-ultra-253b-v1?ncid=so-twit-273200。

转载请注明来自灵通资讯网,本文标题:《英伟达惊开源新模型!性能直逼DeepSeek-R1,4倍推理吞吐量超震撼!》

每一天,每一秒,你所做的决定都会改变你的人生!
评论列表 (暂无评论,3人围观)参与讨论

还没有评论,来说两句吧...