搞懂Harness:AI代理高效工作的关键
作者简介
作者:@rohit4verse
引言:正确使用AI的关键
你用错AI,不是因为没有找到正确的模型,而是因为没有构建正确的环境。有些团队用三名工程师交付了百万行代码,而另一些团队却难以实现一次稳定的重构。
Harness的核心概念
Harness是语言模型运作其中的完整设计环境,包括它可以调用的工具、它所接收信息的格式、它的历史记录如何被压缩和管理、在错误级联之前捕获它的护栏,以及让它能够将工作移交给未来的自己而不失去连贯性的脚手架。
第一部分:无人谈论的问题
为什么原始能力还不够?2024年中,研究人员开始注意到,同一个前沿模型在完全相同的编程任务上,会因任务呈现方式和可用工具的不同而产生截然不同的结果。
上下文窗口不是内存插槽
对AI agent的朴素认知模型,将上下文窗口视为内存。这种心智模型是错误的,而且错误的方式会毁掉你以此为基础构建的agent。
第二部分:SWE-Agent论文与ACI的诞生
Agent-计算机接口究竟是什么?ACI在SWE-agent论文中被定义为位于语言模型agent与计算机环境之间的一个抽象层。
第三部分:Anthropic的Harness工程
Anthropic的工程团队在开发Claude Agent SDK和Claude Code的过程中,遭遇了一个不同的问题:如果一项任务过于庞大,无法在单个上下文窗口内完成,该怎么办?
第四部分:OpenAI的Harness工程
2025年8月下旬,OpenAI的Codex团队以一个唯一的约束条件创建了一个git代码库:无人工编写代码。代码库中的每一行代码都将由Codex agent编写。
第五部分:Awesome Agent Harness分类体系
生态系统图谱由GitHub上AutoJunjie项目维护的Awesome Agent Harness代码库,试图绘制harness工程工具链这一新兴生态系统的全景图。
第六部分:反复出现的设计模式
纵观所有这些系统和组织,若干设计模式反复出现。这并非巧合,而是在尝试大规模可靠部署agent时涌现出的问题所对应的工程解决方案。
第七部分:这对工程师究竟意味着什么
可迁移的技能。HARNESS工程这一学科,本质上是将系统思维应用于agent环境。
第八部分:构建你自己的Harness
最小可用Harness。你不需要构建OpenAI的可观测性技术栈,也不需要Anthropic完整的双agent架构,就能从harness思维中获益。
最后一件事
变革性技术在早期阶段被误读,往往存在一个共同的规律。吸引公众眼球的东西鲜少是决定长期胜负的因素。基础设施层、harness、环境,通常才是真正价值被创造和捕获的地方。






