正文

搞懂Harness：AI代理高效工作的关键

编辑：Wendy发布时间：9小时前

作者：@rohit4verse

你用错AI，不是因为没有找到正确的模型，而是因为没有构建正确的环境。有些团队用三名工程师交付了百万行代码，而另一些团队却难以实现一次稳定的重构。

Harness是语言模型运作其中的完整设计环境，包括它可以调用的工具、它所接收信息的格式、它的历史记录如何被压缩和管理、在错误级联之前捕获它的护栏，以及让它能够将工作移交给未来的自己而不失去连贯性的脚手架。

为什么原始能力还不够？2024年中，研究人员开始注意到，同一个前沿模型在完全相同的编程任务上，会因任务呈现方式和可用工具的不同而产生截然不同的结果。

对AI agent的朴素认知模型，将上下文窗口视为内存。这种心智模型是错误的，而且错误的方式会毁掉你以此为基础构建的agent。

Agent-计算机接口究竟是什么？ACI在SWE-agent论文中被定义为位于语言模型agent与计算机环境之间的一个抽象层。

Anthropic的工程团队在开发Claude Agent SDK和Claude Code的过程中，遭遇了一个不同的问题：如果一项任务过于庞大，无法在单个上下文窗口内完成，该怎么办？

2025年8月下旬，OpenAI的Codex团队以一个唯一的约束条件创建了一个git代码库：无人工编写代码。代码库中的每一行代码都将由Codex agent编写。

生态系统图谱由GitHub上AutoJunjie项目维护的Awesome Agent Harness代码库，试图绘制harness工程工具链这一新兴生态系统的全景图。

纵观所有这些系统和组织，若干设计模式反复出现。这并非巧合，而是在尝试大规模可靠部署agent时涌现出的问题所对应的工程解决方案。

可迁移的技能。HARNESS工程这一学科，本质上是将系统思维应用于agent环境。

最小可用Harness。你不需要构建OpenAI的可观测性技术栈，也不需要Anthropic完整的双agent架构，就能从harness思维中获益。

变革性技术在早期阶段被误读，往往存在一个共同的规律。吸引公众眼球的东西鲜少是决定长期胜负的因素。基础设施层、harness、环境，通常才是真正价值被创造和捕获的地方。