正文

黄仁勋的「Agent工厂」里,装了什么新故事?

编辑:星球日报发布时间:5小时前

原文作者:李海伦 苏扬

原文编辑:徐青阳

原文来源:腾讯科技

2026年6月1日,在COMPUTEX 2026期间举办的NVIDIA GTC Taipei大会上,英伟达创始人兼CEO黄仁勋发表主题演讲。

距离上一场GTC,不过三个月。

当时,英伟达发布了Vera Rubin的“芯片全家桶”,包括:Vera CPU、Rubin GPU、Groq 3 LPU、ConnectX-9、BlueField-4 DPU、Spectrum-6交换机,六颗芯片构成一台机架级AI超算,并宣告训练大型MoE模型所需GPU数量降至四分之一,推理吞吐量每瓦提升10倍,单token成本降至十分之一。

和之前强调“芯片全家桶”、“算力全家桶”这种系统级解决方案不同,三个月后COMPUTEX,黄仁勋把目光投向这些基础设施将服务的目标——Agent。

黄仁勋在演讲中透露:Vera Rubin正式进入量产,Vera CPU开始向全球交付,DGX Station第一次以Windows形态走进企业桌面,Cosmos 3重构物理AI的感知框架,DSX成为AI工厂的运营操作系统。英伟达还联合宇树发布了H2 Plus——首款基于Isaac GR00T的人形机器人参考设计,把Agent的边界从数字世界延伸到物理形态。

英伟达正在围绕Agent生态,重新组织从芯片、数据中心、模型、软件到机器人平台的完整技术体系。

黄仁勋说:“Agent AI和实用型人工智能时代已经到来。现在token(也称‘词元’)是利润单位,AI是GDP‘生成器’,软件工程师的数量正在增加。人们谈论AI减少了工作岗位,这完全是胡说八道,实际上有更多的软件工程师正在被雇用”。

黄仁勋的「Agent工厂」里,装了什么新故事?

同样的AI工厂,跑出10倍Agent任务

Vera Rubin平台已全面投产。

与过去主要面向大模型训练和推理不同,Vera Rubin从设计之初就把Agent作为重点工作负载。

黄仁勋在演讲中表示,一个Agent任务往往不只是一次模型推理,而是包含推理、搜索、工具调用、代码执行和结果验证等多个环节,背后可能涉及数千个步骤。未来数据中心需要处理的,也不再只是单个模型请求,更多的是大量持续运行、相互协作的Agent任务。

该平台被定义为一个巨大的、统一的计算单元级AI超级计算机,专为处理从推理、检索到工具使用的智能体工作负载而构建。在同样规模的超大型数据中心里,用全新的 Vera Rubin 平台来运行自主 AI 智能体的任务,其处理效率是上一代 Grace Blackwell平台的10倍。

除了计算平台本身,网络也成为Vera Rubin升级的重点之一。

过去数据中心里,GPU之间的数据传输主要依赖传统光模块和交换机架构,但当集群规模持续扩大后,功耗、散热和部署复杂度都会快速上升。为此,英伟达在Vera Rubin平台中引入了Spectrum-X Ethernet Photonics网络系统。

这是英伟达首次将共封装光学(CPO)技术大规模引入AI数据中心网络。

简单来说,传统方案需要把光模块插在交换机外部,而CPO则直接把光学器件集成到交换机内部,从而减少能耗和信号损失。

此外,安全也是此次Vera Rubin平台重点强调的核心能力。

为此,英伟达将机密计算(Confidential Computing)能力扩展到整个Vera Rubin平台。通过可信执行环境、硬件级验证以及端到端加密机制,企业能够在处理私有数据、行业敏感信息和关键模型时获得更高等级的安全保障。

黄仁勋透露,Vera Rubin已经进入量产阶段。作为第三代MGX机架级系统,其背后涉及超过150家合作伙伴、350多座工厂以及覆盖30多个国家和地区的供应链体系。按照英伟达公布的计划,Vera Rubin将于今年秋季开始正式出货。

黄仁勋的「Agent工厂」里,装了什么新故事?

“为Agent而生”的处理器

英伟达推出了专为智能体时代设计的新型处理器Vera,并已全面投产。

黄仁勋指出,内存系统的进步将推动存储系统进行创新和现代化升级。至今为止的所有CPU都是为人类打造的,而Vera是为AI时代设计的CPU,为智能体打造。

作为Grace的继任者,Vera采用了英伟达自主设计的“Olympus” CPU核心架构,核心数量从72个提升至88个,并大幅提高内存和数据处理能力。据英伟达介绍,在Agent相关工作负载测试中,Vera的任务执行速度达到同期x86服务器CPU的1.8倍。

相比单纯的性能提升,更重要的变化在于Vera与Rubin GPU之间的关系:Vera通过第二代NVLink-C2C与Rubin GPU连接,互联带宽达到1.8TB/s,Agent运行过程中在CPU和GPU之间传递数据的开销进一步降低。

黄仁勋表示,Vera Rubin采用美光、SK海力士和三星的HBM(高带宽内存),供应链规模是上一代Blackwell的“两倍”。不过,部署一个大型Blackwell机架需要两个小时,而Vera Rubin的时间被压缩到5分钟级别。

黄仁勋的「Agent工厂」里,装了什么新故事?

让AI工厂从“建设”走向“运营”

NVIDIA这次推出的DSX,可以理解为一套“AI工厂建设和运营工具箱”。

过去建设AI数据中心,客户需要分别考虑服务器、网络、电力、冷却、机房设计和运维系统,很多环节依赖不同供应商协同。DSX要做的,是把这些原本分散的环节放到同一个框架里,让客户从设计、仿真、建设到运营,都有一套可参考、可验证的标准方案。

黄仁勋在发布会现场表示:NVIDIA不只是卖芯片,而是要给基础设施建设者一套完整的AI工厂蓝图。

这次DSX最重要的新增能力主要有两个。

第一个是DSX MaxLPS。它解决的是AI工厂最现实的问题:在电力预算固定的情况下,如何放下更多GPU、跑出更多Token。

按照英伟达的说法,MaxLPS结合液冷和机架内功耗优化,可以让运营商在不明显影响性能的情况下,多运行最多40%的GPU。

第二个是DSX OS。它相当于AI工厂的运营软件,负责生命周期管理、智能调度、健康监测、故障恢复、多租户管理等工作。简单来说,如果AI工厂是一座复杂工厂,DSX OS负责让这座工厂持续稳定运转。

在DSX的产品矩阵当中,Reference Design提供AI工厂参考设计,告诉客户机房、机架、网络、电力和冷却系统应该如何搭建;DSX Sim负责仿真,让客户在建设前先验证设计是否可行;DSX Flex把AI工厂和电网连接起来,让数据中心可以根据电价、负荷和需求响应信号调整任务;DSX Exchange则负责打通IT系统、运营系统、能源和冷却系统之间的数据接口。

在生态系统方面,CoreWeave、Crusoe、Lambda等云合作伙伴正部署DSX Sim、MaxLPS和DSX OS以降低风险并提高GPU利用率。戴尔、HPE、联想、Supermicro以及华硕、富士康、技嘉、云达科技等制造商正构建支持DSX的系统。 

与Windows和ARM抱团

现场演讲中,黄仁勋官宣“DGX Station for Windows”工作站登台亮相,被英伟达定义为面向Windows生态的桌面级AI超级计算机。

硬件上,它搭载GB300 Grace Blackwell Ultra Desktop Superchip,通过NVLink-C2C连接Blackwell Ultra GPU与72核Grace CPU,最高提供748GB统一内存和20 PFLOPS FP4性能,并配备最高800Gb/s网络能力。

这款产品的重点在于Agent部署方式的变化。

英伟达希望企业能够在本地、安全、可管理的Windows环境中运行多个Agent,并将其接入设计、工程、数据科学、推理和Physical AI等工作流。同步推出的OpenShell负责Agent运行安全,通过隔离沙箱和系统级策略控制,限制Agent越权操作或泄露凭证、私有数据。

除了面向企业桌面的产品,黄仁勋还在会上发了一颗系统级SoC——RTX Spark SoC,把N1X CPU和Blackwell GPU做进了一块芯片上,统一内存架构,专门给轻薄笔记本和小型台式机用。

其中,N1X是英伟达与微软共同打造的首款PC处理器,它基于Arm架构,由联发科定制设计,台积电3纳米工艺制造。今秋首发搭载于微软、戴尔、惠普、华硕、联想和微星的笔记本,首批超过30款机型,主打高端轻薄本。

这是英伟达为AI PC时代准备的“超级芯”,黄仁勋把它视为PC形态的一次重要重构。

黄仁勋的「Agent工厂」里,装了什么新故事?

Agent的“两个大脑”

这次发布会上,英伟达公布了两条核心模型产品线的最新进展,分别对应Agent的两个场景:一个跑在企业系统里,一个跑在物理世界中。

英伟达发布了一款拥有5500亿参数的混合专家模型Nemotron 3 Ultra,可为代码开发、科研及企业业务流程中的长效智能体提供顶尖智能能力。相较于同级别主流开源前沿模型,该模型推理速度最高提升5倍,使用成本最高降低30%,助力智能体更高效、低成本地完成各项任务。

围绕Nemotron开放模型,英伟达发布了一系列软件、开源模型和合作进展,目标是让企业在工程设计、医疗健康、软件开发和业务运营等场景中,构建能够协助员工工作的“数字同事”。

这套组合里,Nemotron提供基础模型能力,NemoClaw负责把模型组织成Agent,OpenShell负责运行时安全,Agent Toolkit则把CUDA-X等英伟达软件库变成Agent可以直接调用的工具。Agent可以在受控环境中使用工具、调用数据、执行任务,并接入企业现有系统。

黄仁勋表示,全球软件公司正在把AI Agent带入真实工作系统,让它们帮助员工更快完成复杂任务。NemoClaw提供了构建长期运行Agent所需的开放组件,包括编排、上下文、记忆、工具调用和安全控制等能力。

过去企业讨论AI,更多关注模型能回答什么;现在英伟达要解决的是,Agent如何安全地接入工具、数据和业务流程,并在真实工作中持续运行。

还有Cosmos 3,作为Cosmos系列的第三代正式发布,也是一次架构层面的重构。

Cosmos 3是一个面向物理AI的世界基础模型,提供“理解物理世界、预测会发生什么、决定怎么做”的底层能力。

和此前的Cosmos相比,早期版本主要面向机器人和自动驾驶开发者,做的是视频生成和物理世界模拟,本质上是个相对单模态的生成框架。Cosmos 3换了一套架构——混合Transformer,首次把视觉推理、世界生成和动作预测三件事统一到了一个系统里。

它能原生理解并生成文本、图像、视频、环境声音和动作,在物理准确性上达到领先水平,是全球首个完全开放的全能模型。英伟达称,它有望把物理AI的训练和评估周期从过去的数月压缩到数天。

黄仁勋预测,得益于多模态推理语言、视觉和世界模型的突破,物理AI的大爆炸即将来临。

Cosmos 3系列开放的前沿全能模型为开发者提供了代际飞跃的能力,用于构建能够在物理世界中感知、推理、规划和行动的机器人、自动驾驶汽车和视觉AI。 

降低Physical AI门槛

英伟达与宇树联合发布H2 Plus——一台为研究和开发者准备的人形机器人样板机。

“样板”的意思是:宇树负责机器人本体,英伟达负责软件和计算平台,两边把硬件和软件预先整合好,开发团队拿到就能直接开始做技能开发,不用自己再花时间解决底层对接问题。它也是全球首款基于NVIDIA Isaac GR00T开发平台构建的开放式人形机器人。

这款样板机瞄准的是人形机器人开发中一个长期存在的痛点:硬件集成、数据采集、仿真、训练、评估、部署,各环节各自为战,整个流程高度碎片化。

英伟达表示,研究团队拿到一个机器人本体,往往要花大量时间在底层拼凑上,真正的技能开发反而被一再推后。H2 Plus尝试做的事,就是把这条路打通,让研究团队跳过底层集成,直接进入技能开发和真实场景验证。

在黄仁勋看来,人形机器人将为全球最大的产业带来物理AI,开启数万亿美元的经济机遇,而H2 Plus就是把前沿研究往工厂、仓库、物流系统这些真实场景推进的起点。

此外,英伟达还宣布,正式开源一套物理AI Skills(技能)工具集,覆盖机器人、自动驾驶、视觉AI和工业数字孪生等核心场景。

所谓“技能”,可以理解为英伟达把自己旗下的Cosmos、Omniverse、Isaac、Metropolis等平台的使用方式标准化之后,写成了智能体可以直接读懂、直接执行的操作指令,这些指令打包开源出来,就是这次发布的工具集。

智能体接到一个任务,比如生成一批检测缺陷的训练数据,它就知道该调用哪个模型、输出什么格式、怎么验证结果,整个过程自动跑完,不需要人一步步去操作每个环节。 

升级AI存储:从“跑得快”到“管得住”

在3月份的圣何塞GTC上,英伟达发布了Vera BlueField-4 STX,当时黄仁勋重点讲的是“AI原生存储架构”,核心卖点是为智能体长上下文推理提供高性能KV Cache存储支撑。

现在,英伟达在STX基础上宣布新增一套安全能力,重点从“存储性能”变成了“存储安全”。

这里的核心逻辑和思考,是因为背景是企业AI的使用方式在变化。现在很多企业都积极部署智能体,当Agent接入企业系统,在无人直接监督的情况下持续读写、跨系统共享信息——谁在访问什么数据、有没有越权、有没有泄露,这都是企业头疼的问题。

英伟达的解法是,在加速存储的基础上加了一层安全能力——靠着一套统一的 NVIDIA DOCA 安全软件,以及在 BlueField-4 芯片里直接硬性执行策略,基于 STX 的平台可以实时检查和管控代理、数据和上下文记忆之间的互动,帮企业在 AI 数据路径上实现持续的策略执行。

黄仁勋解释称:“智能体把企业数据变成了一个实时、活生生的系统,而这个系统必须在数据移动之处、上下文存储之处、智能体行动之处都得到保护。Vera BlueField-4 STX要做的,就是用天生安全的设计,在芯片中以AI的速度执行信任”。 

与台积电“互为供应商”

这次大会中,非常有意思的一个点是英伟达和台积电的合作——目前,台积电正利用NVIDIA技术提升先进晶圆厂的周转时间、能效、良率与运营生产力。

台积电和英伟达的关系,过去三十年只有一种形态:台积电帮英伟达造芯片。但现在,角色发生了微妙的变化,英伟达开始帮台积电“管工厂”。

黄仁勋表示:“英伟达和台积电已合作近三十年,不断推动计算的极限。台积电正在将英伟达的AI和加速计算引入晶圆厂内部,通过仿真、优化和AI应对全球最复杂的设计和制造挑战,以提高下一代芯片的速度、效率和良率。”

两者的关系,从单向的甲乙方,变成了双向的相互依存。 

结语

回看这场发布会,英伟达正在围绕“Agent”拼凑新的蓝图。

Vera CPU为Agent调度任务,Vera Rubin为Agent提供算力,BlueField-4 STX为Agent守住数据安全,Cosmos 3让Agent理解物理世界,Nemotron+NemoClaw+OpenShell让Agent可以被组织、被调用、被约束,DGX Station for Windows让Agent进入企业员工的桌面,H2 Plus让Agent拥有身体,DSX和Skills让这一切可以被批量生产、批量部署。

从这个角度看,黄仁勋试图描绘的是一个新的计算时代。这也呼应了他在开场提到的“Agent AI和实用型人工智能时代已经到来”。

归根结底,黄仁勋这次想讲的就是一件事:当Agent成为AI基础设施,每一层都能有英伟达。