NVIDIA在GTC 2026发布NemoClaw框架与Nemotron 3模型
NVIDIA发布开源NemoClaw及高性能AI模型
NVIDIA在GTC 2026大会上宣布推出开源框架NemoClaw,允许用户在RTX PC和DGX系统上本地运行自主AI代理,无需支付按令牌计费的云费用。此外,公司还发布了参数量高达1200亿的Nemotron 3 Super模型,该模型在PinchBench测试中得分85.6%,成为当前性能最佳的开放模型之一。
市场背景与股价动态
此次发布的时机颇为关键。3月17日,NVIDIA股价收于180.20美元,当日下跌2.8%。与此同时,公司正进一步进军个人AI计算领域。本周早些时候,DGX Station的订单开放,将数据中心级AI性能引入桌面设备。
NemoClaw的核心功能
NemoClaw解决了阻碍AI代理普及的两大痛点:令牌成本和隐私问题。该框架包含用于本地推理的Nemotron开源模型以及确保安全执行的OpenShell运行时。通过本地推理,用户无需支付API费用,同时数据完全保留在本地设备上。
NemoClaw专注于新兴的“OpenClaw”类别——即能够访问个人文件、应用程序和工作流以自动完成任务的自主AI助手。这一功能相当于赋予AI代理对计算机的完全控制权,因此安全性尤为重要。
Nemotron 3模型系列
NVIDIA推出了三个版本的Nemotron 3模型,以适应不同的硬件配置:
Nemotron 3 Super(1200亿参数,120亿活跃):专为DGX Spark和RTX PRO工作站设计。DGX Spark的128GB统一内存可轻松处理此类规模的模型。
Nemotron 3 Nano 4B:面向GeForce RTX用户的紧凑型选项,适合在VRAM有限的消费级硬件上运行游戏NPC和对话应用。
Mistral还贡献了Mistral Small 4模型,参数量为1190亿,但仅激活60亿参数,专为聊天和编码任务优化。两款大型模型均可在DGX Spark和RTX PRO GPU上本地运行。
DGX Spark采用Grace Blackwell超级芯片,具有共享的CPU-GPU内存设计,能够运行高达2000亿参数的模型,而普通RTX显卡难以胜任。
创意工具性能提升
在内容创作方面,Lightricks的LTX 2.3音视频模型新增对NVFP4和FP8量化支持,性能提升了2.1倍。Black Forest Labs的FLUX.2 Klein 9B也进行了类似优化,在RTX硬件上将图像编辑时间缩短了一半。
NVIDIA还预览了将于今年秋季推出的DLSS 5技术,该技术通过AI升级为游戏渲染注入“逼真的光照和材质”效果。
更大的战略布局
NVIDIA押注个人AI计算将遵循个人计算的发展轨迹。公司将“代理计算机”定位为一种新型设备类别,这表明其认为市场正朝着专用硬件方向发展——这些硬件将运行了解用户文件、日程安排和偏好的AI助手。
然而,用户是否愿意接受这种始终在线并拥有深度访问权限的AI仍然是一个悬而未决的问题。不过,NVIDIA并未等待答案揭晓。GTC与会者可在3月19日前参加“build-a-claw”活动,定制自己的AI代理并将其连接到首选的消息应用。
目前,这些模型已通过Ollama、LM Studio和llama.cpp平台提供。Unsloth Studio作为一款支持500多个模型的新网页版微调界面,也同步上线,方便用户根据特定工作流自定义模型。






