英伟达开源新模型
今日,英伟达开源了名为Llama-3.1-Nemotron-Ultra-253B-v1的新模型。它基于Meta早期模型开发,有2530亿参数,在多项测试中表现出色。英伟达新模型性能逼近DeepSeek R1,参数量不到其一半。测试结果显示,在GPQA、IFEval指令遵循和LiveCodeBench编码任务中表现优异,推理吞吐量比DeepSeek R1高4倍。不过在部分基准测试中,DeepSeek R1仍略占优势。
技术特点与应用场景
Llama-3.1-Nemotron-Ultra-253B采用神经架构搜索优化架构等技术。其代码已公开,可用于聊天机器人开发等场景,还获准商业用途。Llama-3.1-Nemotron-Ultra-253B的体验地址为https://build.nvidia.com/nvidia/llama-3_1-nemotron-ultra-253b-v1?ncid=so-twit-273200。
转载请注明来自灵通资讯网,本文标题:《英伟达惊开源新模型!性能直逼DeepSeek-R1,4倍推理吞吐量超震撼!》
还没有评论,来说两句吧...