正文

黄仁勋的「Agent工厂」里，装了什么新故事？

编辑：星球日报发布时间：5小时前

原文作者：李海伦苏扬

原文编辑：徐青阳

原文来源：腾讯科技

2026年6月1日，在COMPUTEX 2026期间举办的NVIDIA GTC Taipei大会上，英伟达创始人兼CEO黄仁勋发表主题演讲。

距离上一场GTC，不过三个月。

当时，英伟达发布了Vera Rubin的“芯片全家桶”，包括：Vera CPU、Rubin GPU、Groq 3 LPU、ConnectX-9、BlueField-4 DPU、Spectrum-6交换机，六颗芯片构成一台机架级AI超算，并宣告训练大型MoE模型所需GPU数量降至四分之一，推理吞吐量每瓦提升10倍，单token成本降至十分之一。

和之前强调“芯片全家桶”、“算力全家桶”这种系统级解决方案不同，三个月后COMPUTEX，黄仁勋把目光投向这些基础设施将服务的目标——Agent。

黄仁勋在演讲中透露：Vera Rubin正式进入量产，Vera CPU开始向全球交付，DGX Station第一次以Windows形态走进企业桌面，Cosmos 3重构物理AI的感知框架，DSX成为AI工厂的运营操作系统。英伟达还联合宇树发布了H2 Plus——首款基于Isaac GR00T的人形机器人参考设计，把Agent的边界从数字世界延伸到物理形态。

英伟达正在围绕Agent生态，重新组织从芯片、数据中心、模型、软件到机器人平台的完整技术体系。

黄仁勋说：“Agent AI和实用型人工智能时代已经到来。现在token（也称‘词元’）是利润单位，AI是GDP‘生成器’，软件工程师的数量正在增加。人们谈论AI减少了工作岗位，这完全是胡说八道，实际上有更多的软件工程师正在被雇用”。

黄仁勋的「Agent工厂」里，装了什么新故事？

同样的AI工厂，跑出10倍Agent任务

Vera Rubin平台已全面投产。

与过去主要面向大模型训练和推理不同，Vera Rubin从设计之初就把Agent作为重点工作负载。

黄仁勋在演讲中表示，一个Agent任务往往不只是一次模型推理，而是包含推理、搜索、工具调用、代码执行和结果验证等多个环节，背后可能涉及数千个步骤。未来数据中心需要处理的，也不再只是单个模型请求，更多的是大量持续运行、相互协作的Agent任务。

该平台被定义为一个巨大的、统一的计算单元级AI超级计算机，专为处理从推理、检索到工具使用的智能体工作负载而构建。在同样规模的超大型数据中心里，用全新的 Vera Rubin 平台来运行自主 AI 智能体的任务，其处理效率是上一代 Grace Blackwell平台的10倍。

除了计算平台本身，网络也成为Vera Rubin升级的重点之一。

过去数据中心里，GPU之间的数据传输主要依赖传统光模块和交换机架构，但当集群规模持续扩大后，功耗、散热和部署复杂度都会快速上升。为此，英伟达在Vera Rubin平台中引入了Spectrum-X Ethernet Photonics网络系统。

这是英伟达首次将共封装光学（CPO）技术大规模引入AI数据中心网络。

简单来说，传统方案需要把光模块插在交换机外部，而CPO则直接把光学器件集成到交换机内部，从而减少能耗和信号损失。

此外，安全也是此次Vera Rubin平台重点强调的核心能力。

为此，英伟达将机密计算（Confidential Computing）能力扩展到整个Vera Rubin平台。通过可信执行环境、硬件级验证以及端到端加密机制，企业能够在处理私有数据、行业敏感信息和关键模型时获得更高等级的安全保障。

黄仁勋透露，Vera Rubin已经进入量产阶段。作为第三代MGX机架级系统，其背后涉及超过150家合作伙伴、350多座工厂以及覆盖30多个国家和地区的供应链体系。按照英伟达公布的计划，Vera Rubin将于今年秋季开始正式出货。

黄仁勋的「Agent工厂」里，装了什么新故事？

“为Agent而生”的处理器

英伟达推出了专为智能体时代设计的新型处理器Vera，并已全面投产。

黄仁勋指出，内存系统的进步将推动存储系统进行创新和现代化升级。至今为止的所有CPU都是为人类打造的，而Vera是为AI时代设计的CPU，为智能体打造。

作为Grace的继任者，Vera采用了英伟达自主设计的“Olympus” CPU核心架构，核心数量从72个提升至88个，并大幅提高内存和数据处理能力。据英伟达介绍，在Agent相关工作负载测试中，Vera的任务执行速度达到同期x86服务器CPU的1.8倍。

相比单纯的性能提升，更重要的变化在于Vera与Rubin GPU之间的关系：Vera通过第二代NVLink-C2C与Rubin GPU连接，互联带宽达到1.8TB/s，Agent运行过程中在CPU和GPU之间传递数据的开销进一步降低。

黄仁勋表示，Vera Rubin采用美光、SK海力士和三星的HBM（高带宽内存），供应链规模是上一代Blackwell的“两倍”。不过，部署一个大型Blackwell机架需要两个小时，而Vera Rubin的时间被压缩到5分钟级别。

黄仁勋的「Agent工厂」里，装了什么新故事？

让AI工厂从“建设”走向“运营”

NVIDIA这次推出的DSX，可以理解为一套“AI工厂建设和运营工具箱”。

过去建设AI数据中心，客户需要分别考虑服务器、网络、电力、冷却、机房设计和运维系统，很多环节依赖不同供应商协同。DSX要做的，是把这些原本分散的环节放到同一个框架里，让客户从设计、仿真、建设到运营，都有一套可参考、可验证的标准方案。

黄仁勋在发布会现场表示：NVIDIA不只是卖芯片，而是要给基础设施建设者一套完整的AI工厂蓝图。

这次DSX最重要的新增能力主要有两个。

第一个是DSX MaxLPS。它解决的是AI工厂最现实的问题：在电力预算固定的情况下，如何放下更多GPU、跑出更多Token。

按照英伟达的说法，MaxLPS结合液冷和机架内功耗优化，可以让运营商在不明显影响性能的情况下，多运行最多40%的GPU。

第二个是DSX OS。它相当于AI工厂的运营软件，负责生命周期管理、智能调度、健康监测、故障恢复、多租户管理等工作。简单来说，如果AI工厂是一座复杂工厂，DSX OS负责让这座工厂持续稳定运转。

在DSX的产品矩阵当中，Reference Design提供AI工厂参考设计，告诉客户机房、机架、网络、电力和冷却系统应该如何搭建；DSX Sim负责仿真，让客户在建设前先验证设计是否可行；DSX Flex把AI工厂和电网连接起来，让数据中心可以根据电价、负荷和需求响应信号调整任务；DSX Exchange则负责打通IT系统、运营系统、能源和冷却系统之间的数据接口。

在生态系统方面，CoreWeave、Crusoe、Lambda等云合作伙伴正部署DSX Sim、MaxLPS和DSX OS以降低风险并提高GPU利用率。戴尔、HPE、联想、Supermicro以及华硕、富士康、技嘉、云达科技等制造商正构建支持DSX的系统。

与Windows和ARM抱团

现场演讲中，黄仁勋官宣“DGX Station for Windows”工作站登台亮相，被英伟达定义为面向Windows生态的桌面级AI超级计算机。

硬件上，它搭载GB300 Grace Blackwell Ultra Desktop Superchip，通过NVLink-C2C连接Blackwell Ultra GPU与72核Grace CPU，最高提供748GB统一内存和20 PFLOPS FP4性能，并配备最高800Gb/s网络能力。

这款产品的重点在于Agent部署方式的变化。

英伟达希望企业能够在本地、安全、可管理的Windows环境中运行多个Agent，并将其接入设计、工程、数据科学、推理和Physical AI等工作流。同步推出的OpenShell负责Agent运行安全，通过隔离沙箱和系统级策略控制，限制Agent越权操作或泄露凭证、私有数据。

除了面向企业桌面的产品，黄仁勋还在会上发了一颗系统级SoC——RTX Spark SoC，把N1X CPU和Blackwell GPU做进了一块芯片上，统一内存架构，专门给轻薄笔记本和小型台式机用。

其中，N1X是英伟达与微软共同打造的首款PC处理器，它基于Arm架构，由联发科定制设计，台积电3纳米工艺制造。今秋首发搭载于微软、戴尔、惠普、华硕、联想和微星的笔记本，首批超过30款机型，主打高端轻薄本。

这是英伟达为AI PC时代准备的“超级芯”，黄仁勋把它视为PC形态的一次重要重构。

黄仁勋的「Agent工厂」里，装了什么新故事？

Agent的“两个大脑”

这次发布会上，英伟达公布了两条核心模型产品线的最新进展，分别对应Agent的两个场景：一个跑在企业系统里，一个跑在物理世界中。

英伟达发布了一款拥有5500亿参数的混合专家模型Nemotron 3 Ultra，可为代码开发、科研及企业业务流程中的长效智能体提供顶尖智能能力。相较于同级别主流开源前沿模型，该模型推理速度最高提升5倍，使用成本最高降低30%，助力智能体更高效、低成本地完成各项任务。

围绕Nemotron开放模型，英伟达发布了一系列软件、开源模型和合作进展，目标是让企业在工程设计、医疗健康、软件开发和业务运营等场景中，构建能够协助员工工作的“数字同事”。

这套组合里，Nemotron提供基础模型能力，NemoClaw负责把模型组织成Agent，OpenShell负责运行时安全，Agent Toolkit则把CUDA-X等英伟达软件库变成Agent可以直接调用的工具。Agent可以在受控环境中使用工具、调用数据、执行任务，并接入企业现有系统。

黄仁勋表示，全球软件公司正在把AI Agent带入真实工作系统，让它们帮助员工更快完成复杂任务。NemoClaw提供了构建长期运行Agent所需的开放组件，包括编排、上下文、记忆、工具调用和安全控制等能力。

过去企业讨论AI，更多关注模型能回答什么；现在英伟达要解决的是，Agent如何安全地接入工具、数据和业务流程，并在真实工作中持续运行。

还有Cosmos 3，作为Cosmos系列的第三代正式发布，也是一次架构层面的重构。

Cosmos 3是一个面向物理AI的世界基础模型，提供“理解物理世界、预测会发生什么、决定怎么做”的底层能力。

和此前的Cosmos相比，早期版本主要面向机器人和自动驾驶开发者，做的是视频生成和物理世界模拟，本质上是个相对单模态的生成框架。Cosmos 3换了一套架构——混合Transformer，首次把视觉推理、世界生成和动作预测三件事统一到了一个系统里。

它能原生理解并生成文本、图像、视频、环境声音和动作，在物理准确性上达到领先水平，是全球首个完全开放的全能模型。英伟达称，它有望把物理AI的训练和评估周期从过去的数月压缩到数天。

黄仁勋预测，得益于多模态推理语言、视觉和世界模型的突破，物理AI的大爆炸即将来临。

Cosmos 3系列开放的前沿全能模型为开发者提供了代际飞跃的能力，用于构建能够在物理世界中感知、推理、规划和行动的机器人、自动驾驶汽车和视觉AI。

降低Physical AI门槛

英伟达与宇树联合发布H2 Plus——一台为研究和开发者准备的人形机器人样板机。

“样板”的意思是：宇树负责机器人本体，英伟达负责软件和计算平台，两边把硬件和软件预先整合好，开发团队拿到就能直接开始做技能开发，不用自己再花时间解决底层对接问题。它也是全球首款基于NVIDIA Isaac GR00T开发平台构建的开放式人形机器人。

这款样板机瞄准的是人形机器人开发中一个长期存在的痛点：硬件集成、数据采集、仿真、训练、评估、部署，各环节各自为战，整个流程高度碎片化。

英伟达表示，研究团队拿到一个机器人本体，往往要花大量时间在底层拼凑上，真正的技能开发反而被一再推后。H2 Plus尝试做的事，就是把这条路打通，让研究团队跳过底层集成，直接进入技能开发和真实场景验证。

在黄仁勋看来，人形机器人将为全球最大的产业带来物理AI，开启数万亿美元的经济机遇，而H2 Plus就是把前沿研究往工厂、仓库、物流系统这些真实场景推进的起点。

此外，英伟达还宣布，正式开源一套物理AI Skills（技能）工具集，覆盖机器人、自动驾驶、视觉AI和工业数字孪生等核心场景。

所谓“技能”，可以理解为英伟达把自己旗下的Cosmos、Omniverse、Isaac、Metropolis等平台的使用方式标准化之后，写成了智能体可以直接读懂、直接执行的操作指令，这些指令打包开源出来，就是这次发布的工具集。

智能体接到一个任务，比如生成一批检测缺陷的训练数据，它就知道该调用哪个模型、输出什么格式、怎么验证结果，整个过程自动跑完，不需要人一步步去操作每个环节。

升级AI存储：从“跑得快”到“管得住”

在3月份的圣何塞GTC上，英伟达发布了Vera BlueField-4 STX，当时黄仁勋重点讲的是“AI原生存储架构”，核心卖点是为智能体长上下文推理提供高性能KV Cache存储支撑。

现在，英伟达在STX基础上宣布新增一套安全能力，重点从“存储性能”变成了“存储安全”。

这里的核心逻辑和思考，是因为背景是企业AI的使用方式在变化。现在很多企业都积极部署智能体，当Agent接入企业系统，在无人直接监督的情况下持续读写、跨系统共享信息——谁在访问什么数据、有没有越权、有没有泄露，这都是企业头疼的问题。

英伟达的解法是，在加速存储的基础上加了一层安全能力——靠着一套统一的 NVIDIA DOCA 安全软件，以及在 BlueField-4 芯片里直接硬性执行策略，基于 STX 的平台可以实时检查和管控代理、数据和上下文记忆之间的互动，帮企业在 AI 数据路径上实现持续的策略执行。

黄仁勋解释称：“智能体把企业数据变成了一个实时、活生生的系统，而这个系统必须在数据移动之处、上下文存储之处、智能体行动之处都得到保护。Vera BlueField-4 STX要做的，就是用天生安全的设计，在芯片中以AI的速度执行信任”。

与台积电“互为供应商”

这次大会中，非常有意思的一个点是英伟达和台积电的合作——目前，台积电正利用NVIDIA技术提升先进晶圆厂的周转时间、能效、良率与运营生产力。

台积电和英伟达的关系，过去三十年只有一种形态：台积电帮英伟达造芯片。但现在，角色发生了微妙的变化，英伟达开始帮台积电“管工厂”。

黄仁勋表示：“英伟达和台积电已合作近三十年，不断推动计算的极限。台积电正在将英伟达的AI和加速计算引入晶圆厂内部，通过仿真、优化和AI应对全球最复杂的设计和制造挑战，以提高下一代芯片的速度、效率和良率。”

两者的关系，从单向的甲乙方，变成了双向的相互依存。

结语

回看这场发布会，英伟达正在围绕“Agent”拼凑新的蓝图。

Vera CPU为Agent调度任务，Vera Rubin为Agent提供算力，BlueField-4 STX为Agent守住数据安全，Cosmos 3让Agent理解物理世界，Nemotron+NemoClaw+OpenShell让Agent可以被组织、被调用、被约束，DGX Station for Windows让Agent进入企业员工的桌面，H2 Plus让Agent拥有身体，DSX和Skills让这一切可以被批量生产、批量部署。

从这个角度看，黄仁勋试图描绘的是一个新的计算时代。这也呼应了他在开场提到的“Agent AI和实用型人工智能时代已经到来”。

归根结底，黄仁勋这次想讲的就是一件事：当Agent成为AI基础设施，每一层都能有英伟达。