英伟达发布开源LLM Nemotron Ultra:参数减半,性能超越DeepSeek R1

海外独角兽
04-10

作为 $通用人工智能 ETF-AGIX(AGIX)$ 持仓之一的英伟达 $英伟达(NVDA)$ 近日推出了一款基于Meta Llama-3.1模型构建的全新开源大语言模型(LLM)——Llama-3.1-Nemotron-Ultra-253B-v1(简称Nemotron Ultra)。尽管其参数量(2530亿)仅为竞争对手DeepSeek R1(一个拥有6710亿参数的先进MoE模型)的一半左右,英伟达声称该模型在多项第三方基准测试中展现出接近顶尖的性能,特别是在推理能力方面超越了备受瞩目的DeepSeek R1。

Nemotron Ultra是一款密集型模型,旨在支持高级推理、指令遵循和AI助手工作流程。该模型于2025年4月7日晚间宣布,其代码、开放权重和后训练数据已在Hugging Face平台公开,遵循Nvidia开放模型许可证和Llama 3.1社区许可协议,可用于商业用途。

核心特性与优化:

高效推理设计: 通过神经架构搜索(NAS)定制的架构,引入了跳跃注意力层、融合前馈网络(FFN)和可变FFN压缩比等创新,显著降低了内存占用和计算需求,使得模型可以在单个配备8块H100 GPU的节点上高效部署。同时兼容英伟达B100和Hopper微架构。

可切换推理模式: 模型设计了“推理开启”和“推理关闭”两种模式,开发者可通过系统提示(system prompts)灵活切换,以适应高复杂度推理任务或更直接的输出需求。

多阶段后训练增强: 模型经过了包括数学、代码生成、聊天、工具使用等领域的监督微调(SFT),以及利用组相对策略优化(GRPO)进行的强化学习,进一步提升了指令遵循和推理能力。此外,还经历了知识蒸馏和持续预训练阶段。

性能表现:

评测结果显示,在启用推理模式后,Nemotron Ultra在多个基准测试中性能大幅提升,例如:

MATH500得分从80.40%提升至97.00%。

AIME25得分从16.67%跃升至72.50%。

LiveCodeBench得分从29.03%翻倍至66.31%。

与DeepSeek R1相比,Nemotron Ultra在通用问答(GPQA)、指令遵循(IFEval)和代码任务(LiveCodeBench)等多个方面表现更优或相当。不过,DeepSeek R1在部分数学评估(如AIME25)上仍保持明显优势。这表明英伟达的密集模型在推理和通用指令对齐方面能够匹敌甚至超越规模更大的MoE模型。

使用与集成:

该模型推荐使用Hugging Face Transformers库(版本4.48.3或更高),支持长达128,000个token的输入输出序列。开发者可根据任务需求选择解码策略(如推理任务推荐使用温度采样,确定性输出推荐贪婪解码)。模型支持多种语言,包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等,适用于聊天机器人、AI代理、检索增强生成(RAG)和代码生成等多种应用场景。

英伟达强调了负责任AI开发的重要性,鼓励使用者根据具体应用场景评估模型的对齐性、安全性和偏见。

AGIX指数大幅反弹:AI科技股从关税恐慌中强势回升

AGIX指数在昨日交易中迎来爆发性反弹,三大核心板块全线上涨,其中Infrastructure领涨,大涨5.18%,Application板块上涨4.21%,Semi板块上涨2.56%。

指数成分股中,ARM $ARM Holdings(ARM)$ 表现最为亮眼,暴涨24.2%,特斯拉(TSLA) $特斯拉(TSLA)$ 和Marvell(MRVL)紧随其后,分别大涨22.69%和21.85%。AI领域明星公司Palantir(PLTR)和英伟达(NVDA)也分别上涨19.0%和18.72%,展现出强大的市场信心恢复。值得注意的是,几乎所有主要科技巨头都实现两位数涨幅,包括苹果(15.33%)、Meta(14.76%)、亚马逊(11.98%)和微软(10.13%)。

根据贡献度分析,Meta(14.76%)、英伟达(18.72%)、亚马逊(11.98%)、Palantir(19.0%)和微软(10.13%)是推动AGIX指数上涨的五大主力成分股,充分体现了大型科技公司在AI投资领域的领导地位。

这波强劲反弹是对此前美国政府宣布对中国增加关税所引发市场恐慌的修正。特别是英伟达和Super Micro Computer等公司的股价大幅反弹,因为投资者重新评估了关税政策对科技行业的实际影响程度。报道指出,分析师普遍认为之前的抛售过度,市场对英伟达等龙头企业的长期增长前景维持乐观。

作为专业追踪AI发展进程的指数,AGIX的这一反弹行情印证了尽管短期波动,投资者对AI领域的长期增长潜力仍保持高度信心,也证明了AGIX作为科技投资者首选投资标的的引领作用和市场价值。

特朗普关税再生变!美股你是偏悲观or乐观?
美国白宫在官网的最新声明表示,由于中国采取报复性措施,美对华关税加增至245%。【华尔街纷纷下调标普500指数2025年的目标价,但是数据显示散户投资者还在大量买入TQQQ,,大家现在对于市场,是偏乐观or悲观?】
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

  • 老当益壮铁树开花
    04-10
    老当益壮铁树开花
    已经顾不上芯片了,开始想在AI大模型平台上压过deepseek一头,以报仇血恨?
发表看法
1