正文

NVIDIA在GTC 2026发布NemoClaw框架与Nemotron 3模型

编辑：Luna发布时间：6小时前

NVIDIA发布开源NemoClaw及高性能AI模型

NVIDIA在GTC 2026大会上宣布推出开源框架NemoClaw，允许用户在RTX PC和DGX系统上本地运行自主AI代理，无需支付按令牌计费的云费用。此外，公司还发布了参数量高达1200亿的Nemotron 3 Super模型，该模型在PinchBench测试中得分85.6%，成为当前性能最佳的开放模型之一。

NVIDIA在GTC 2026发布NemoClaw框架与Nemotron 3模型

市场背景与股价动态

此次发布的时机颇为关键。3月17日，NVIDIA股价收于180.20美元，当日下跌2.8%。与此同时，公司正进一步进军个人AI计算领域。本周早些时候，DGX Station的订单开放，将数据中心级AI性能引入桌面设备。

NemoClaw的核心功能

NemoClaw解决了阻碍AI代理普及的两大痛点：令牌成本和隐私问题。该框架包含用于本地推理的Nemotron开源模型以及确保安全执行的OpenShell运行时。通过本地推理，用户无需支付API费用，同时数据完全保留在本地设备上。

NemoClaw专注于新兴的“OpenClaw”类别——即能够访问个人文件、应用程序和工作流以自动完成任务的自主AI助手。这一功能相当于赋予AI代理对计算机的完全控制权，因此安全性尤为重要。

Nemotron 3模型系列

NVIDIA推出了三个版本的Nemotron 3模型，以适应不同的硬件配置：

Nemotron 3 Super（1200亿参数，120亿活跃）：专为DGX Spark和RTX PRO工作站设计。DGX Spark的128GB统一内存可轻松处理此类规模的模型。

Nemotron 3 Nano 4B：面向GeForce RTX用户的紧凑型选项，适合在VRAM有限的消费级硬件上运行游戏NPC和对话应用。

Mistral还贡献了Mistral Small 4模型，参数量为1190亿，但仅激活60亿参数，专为聊天和编码任务优化。两款大型模型均可在DGX Spark和RTX PRO GPU上本地运行。

DGX Spark采用Grace Blackwell超级芯片，具有共享的CPU-GPU内存设计，能够运行高达2000亿参数的模型，而普通RTX显卡难以胜任。

创意工具性能提升

在内容创作方面，Lightricks的LTX 2.3音视频模型新增对NVFP4和FP8量化支持，性能提升了2.1倍。Black Forest Labs的FLUX.2 Klein 9B也进行了类似优化，在RTX硬件上将图像编辑时间缩短了一半。

NVIDIA还预览了将于今年秋季推出的DLSS 5技术，该技术通过AI升级为游戏渲染注入“逼真的光照和材质”效果。

更大的战略布局

NVIDIA押注个人AI计算将遵循个人计算的发展轨迹。公司将“代理计算机”定位为一种新型设备类别，这表明其认为市场正朝着专用硬件方向发展——这些硬件将运行了解用户文件、日程安排和偏好的AI助手。

然而，用户是否愿意接受这种始终在线并拥有深度访问权限的AI仍然是一个悬而未决的问题。不过，NVIDIA并未等待答案揭晓。GTC与会者可在3月19日前参加“build-a-claw”活动，定制自己的AI代理并将其连接到首选的消息应用。

目前，这些模型已通过Ollama、LM Studio和llama.cpp平台提供。Unsloth Studio作为一款支持500多个模型的新网页版微调界面，也同步上线，方便用户根据特定工作流自定义模型。