正文

让Claude真正替你干活:一份系统配置指南

编辑:星球日报发布时间:6小时前

编者按

当我们回看 Claude 在 2026 年的产品演进,会发现一个明显变化:问题不再是「它能做什么」,而是「不同的人,应该如何使用它」。

文章概述

本文基于 Anthropic 自 2026 年以来的产品更新,对 Claude 的能力体系与使用方式进行了系统梳理。文章按照「不同人该用什么、在什么场景下怎么用」的逻辑进行组织。你可以将其视为一份导航:当面对具体任务时,能够快速定位到对应模块,并调用合适的能力。

模型与基础能力

对于第一次接触 Claude 的用户,首先需要理解模型与基础能力,包括上下文窗口、模型分层以及四种使用模式。这些因素共同决定了 Claude 的能力边界,也构成后续使用方式的基础。

Claude 模型层级

Claude Opus 4.6 是当前的性能上限。发布于 2026 年 2 月 5 日,支持 100 万 token 上下文窗口(价格调整后文详述)。在 100 万 token 长上下文下,MRCR v2 得分为 78.3%,是当前同级模型中表现最高的。

在法律、金融和编程等任务中全面领先。Anthropic 报告其任务持续执行能力可达 14.5 小时,为前沿模型中最长。API 价格为 每百万 token 输入 $5 / 输出 $25,最大输出为 128K token。支持自适应推理,并新增「max」级别,用于释放极限能力。

注:MRCR v2 得分是模型在「超长上下文中找对信息」的能力指标。

·适用场景(Opus):复杂大规模上下文分析、代码库重构、深度研究、高风险交付、严肃内容生产,以及一切「质量优先于成本」的任务。

·不适用场景(Opus):任何需要高频调用的工作流。以当前价格计算,一个重度 Opus 使用场景每天可能消耗 $50–100。默认应优先使用 Sonnet,只有在 Sonnet 输出质量不足时再升级到 Opus。

Claude Sonnet 4.6 发布于 2 月 17 日,仅比 Opus 晚 12 天,是大多数用户的默认选择。同样支持 100 万 token 上下文(3 月 13 日起正式可用)。在编码、计算机操作、长上下文推理、Agent 规划、知识工作与设计等方面均有提升。早期测试中,约 70% 用户更偏好 Sonnet 4.6(相比 4.5),在 59% 的场景中甚至超过此前旗舰 Opus 4.5。

在 claude.ai 上作为 Free 与 Pro 用户的默认模型。API 价格为 $3 / $15 每百万 token,最大输出 64K token,相比 4.5 提速约 30–50%。

·适用场景(Sonnet):日常工作、快速草稿、常规编程任务、Agent 工作流——在速度与智能之间取得平衡。在很多办公场景中,它的表现已经接近甚至超过 Opus(Anthropic 的 OfficeQA 基准测试中,部分任务甚至领先),而成本大约低 40%。

Claude Haiku 4.5 是面向高并发场景的低成本、极速模型,主要用于 API 管道或子代理(subagent)任务,例如只读处理型工作。

但有一个重要前提:Haiku 完全不具备 prompt 注入防护能力。如果你在 Agent 系统中用它处理不可信输入,必须谨慎评估风险并仔细阅读官方文档。

上下文窗口价格结构的变化

此前,超过 200K token 的请求需要支付溢价(Opus 价格可达 $10 / $37.5 每百万 token)。但从 3 月 13 日起,这一溢价已完全取消。现在,900K token 和 9K token 的单价完全相同。没有倍率、没有隐藏条件,也不再需要 beta header。

这意味着什么?大约 75 万词的上下文容量,可以一次性加载:整个代码库、完整法律合同、大规模数据集、数月文档记录,并且全部保存在同一个「工作记忆」中。

同时,多模态能力也提升,单次请求最多支持 600 张图片或 PDF 页面(此前为 100,提升 6 倍)。目前,已在 Claude Platform、Microsoft Foundry 和 Google Cloud Vertex AI 上提供。

对团队来说,这改变非常直接:过去需要分块处理(chunking)、摘要管道(summarization pipelines)、滚动窗口管理(rolling context)的内容,现在可以直接全部加载。甚至有公司反馈,将上下文从 200K 提升到 500K 后,总 token 消耗反而下降,因为模型不再反复读取与重处理历史信息。

Claude 的四种使用模式

Claude 提供四种模式,但大多数人只用过其中一种:

Chat

你最熟悉的浏览器 / 移动端界面。适合提问、头脑风暴、写草稿。

每次对话都是从零开始,你始终在主导过程。

Cowork

桌面端 Agent。可以直接读取和修改你的本地文件,自动执行多步骤任务,并把完成结果输出到你的文件夹。

适合「把任务交出去」,而不是来回对话。

Code

开发者模式,运行在终端中。可以访问代码库、写代码、执行命令、管理 Git。

如果你写代码,这里是杠杆最高的地方。

Projects

持久化工作空间。你只需上传一次文件和指令,每次新对话都会自动带上完整上下文。

适用于重复性工作,比如周报、newsletter、客户交付等。

一个简单判断规则:Chat 快速提问,Cowork 让 AI 替你干活,Code 适合开发任务,Projects 稳定上下文的重复工作

让Claude真正替你干活:一份系统配置指南

记忆与个性化

截至 2026 年 3 月 2 日,Claude 已向所有用户(包括免费用户)开放基于聊天历史的记忆功能。Claude 会从你的对话中提取相关上下文,并生成一份可跨会话使用的记忆摘要。你可以在 Settings > Capabilities 中查看、编辑或删除这些记忆。同时,也支持导入与导出完整记忆数据——无论是用于在调整前做备份,还是迁移到新账号,都会很方便。若开启隐身对话(Incognito),对应的内容则不会被写入记忆。

这里的关键操作是:现在就去 Settings > Memory 看一眼 Claude 已经「记住了什么」。把不准确或过时的信息改掉,并补充它应该了解的背景。你的记忆越准确,未来在不同会话中就越不需要反复解释自己。

需要注意的是,Cowork 模式的会话之间不会继承记忆。如果你需要持续上下文,需要通过「上下文文件」来弥补(下文 Limitations 部分会详细说明)。

如何用好 Cowork:面向知识工作者

Cowork 可以说彻底改变了游戏规则。它于 1 月 12 日在 macOS 上以研究预览形式推出(面向 Claude Max 用户),随后在 1 月 16 日扩展至 Pro 用户,1 月 23 日扩展至 Team 和 Enterprise,之后也上线了 Windows 版本。市场的反应也非常直接——投资者迅速意识到这意味着什么,SaaS 公司市值在短短几天内蒸发了数千亿美元,华尔街看懂了这条路径。

但关键在于:不要再把它当成一个聊天界面。

Cowork 的本质是任务委托。

你只需要描述「完成的结果是什么样」,Claude 会自动制定计划、拆解子任务,在你的真实电脑环境中自主执行,并把最终完成的文件交付到你的文件夹里。你可以直接离开,回来时工作已经完成。

让Claude真正替你干活:一份系统配置指南

让Claude真正替你干活:一份系统配置指南

Anthropic 在大约 10 天内,仅使用 Claude Code 就构建出了 Cowork。

环境搭建四步法

那些用不好 Cowork 的人,往往还在沿用旧习惯:为每个任务写一大段冗长、细致的提示词,结果却不稳定。

而真正用明白的人,做的是另一件事: 花一个下午,把「上下文环境」搭好(包括上下文文件、全局指令、文件夹结构),然后只用 10 个词的提示,就能产出可直接交付给客户的结果。

这背后的逻辑是:

ChatGPT 训练你写更好的提示词

Cowork 奖励你构建更好的「文件系统」

前者是一种会随着模型进化而贬值的技能,后者则是会不断复利的能力。

Step 1:搭建你的工作空间文件夹

在电脑上创建一个专门用于 Cowork 的文件夹。

不要直接把它指向整个 Documents(文档)目录。如果出了问题(确实有可能发生),你需要把影响范围控制在最小。因为,Cowork 对你授权的文件夹拥有真实的读写权限。

让Claude真正替你干活:一份系统配置指南

这样做既能保持结构清晰,也能限制 Claude 能访问的范围。几乎所有资深用户的实践最终都会收敛到类似的基础结构。文件夹叫什么并不重要,关键在于一定要做好分层与隔离。

让Claude真正替你干活:一份系统配置指南

Step 2:构建你的上下文文件体系

这是解决「AI 输出同质化」的关键一步。在你的 CONTEXT 文件夹中,建立三个 Markdown 文件:

about-me.md

用于界定你的角色与当前工作重心。这不是简历,而是你日常真实参与的工作,你服务的对象是谁、当前优先级是什么、哪些事项最具业务价值。同时可补充一至两个代表性成果,作为能力与标准的参照。

brand-voice.md

用于固化你的表达风格。包括语气特征、常用与禁用词汇、排版偏好,以及 2–3 段真实写作样本。这是区分「通用 AI 内容」与「具备个人风格输出」的核心分水岭。

working-preferences.md

用于明确 Claude 的执行规范。例如:执行前先提出澄清问题、先输出任务拆解方案、未经确认不进行删除操作、默认输出格式、质量标准以及需要规避的行为等。

这三个文件,可以在短时间内解决「冷启动」问题:缺乏上下文时,每次任务都需从零解释;完成配置后,Claude 在每次会话开始时即具备对你风格、标准与偏好的完整认知。

一个常被忽视的关键点在于,这些上下文文件具有「复利效应」。建议按周持续迭代优化。当 Claude 的输出不符合预期时,应优先判断:这是提示词问题,还是上下文问题。在绝大多数情况下,问题源自上下文。解决路径也很直接:在对应文件中补充一条规则,即可形成长期有效的修正机制。

从实践来看,这一体系的搭建成本极低:我大约用 45 分钟完成了 context folder 的初始构建——三个 .md 文件,分别定义「我是谁」「我在做什么」以及「Claude 的执行方式」。在此基础上,下一次仅用一个 10 个词的项目简报提示,输出即在首次生成时达到预期标准。而在此之前,每一次任务都需要从头重复解释完整工作背景与要求。

让Claude真正替你干活:一份系统配置指南

用户表示「Claude Cowork 在文件处理与编辑方面同样非常实用。你只需用自然语言描述要找的文件(例如「一个有松鼠的视频」),再给出简单的操作指令,Claude 就可以调用 ffmpeg 完成处理。即使你没有任何文件编辑或格式转换的经验,也能顺利完成相关操作。」

Step 3:设置全局指令

进入 Settings > Cowork > Edit Global Instructions。

全局指令会在一切内容之前加载——先于你的文件、先于提示词,甚至在 Claude 读取你的文件夹之前就已生效。它定义的是每一次会话都会遵循的「底层行为规范」。

下面是一份可作为起点的模板:

让Claude真正替你干活:一份系统配置指南

这意味着,即便是最随意、最仓促的提示词,也能产出经过校准的结果。Claude 始终知道你是谁,始终优先读取正确的文件,始终在做出判断前先进行确认。提示词本身,只需要负责当前的具体任务。

Step 4:学会使用 AskUserQuestion

这个功能本质上改变了整个交互方式。不再是你去设计「完美提示词」,而是由 Claude 来设计「完美问题」。当你在任意提示中加入「Start by using AskUserQuestion」,Cowork 会自动生成一个交互式表单:包括多选问题、可点击选项、明确的备选路径,以及一套结构化的问题框架,帮助你在执行前厘清真正需求。

结果是你不再需要从零编写冗长、精细设计的提示词;而是让 Claude 主动判断它需要哪些信息。如果第一轮问题仍未对齐需求,你可以直接指出问题所在,它会生成新一轮问题,持续迭代。

一个几乎适用于所有场景的通用提示模板:

让Claude真正替你干活:一份系统配置指南

就这么简单。这个模板,加上你的上下文文件体系,基本可以覆盖 80% 的使用场景。工作流程始终是一致的,变化的只有上下文本身。

让Claude真正替你干活:一份系统配置指南

Cowork 核心功能

Connectors

上线时间:2 月 24 日。

Claude Cowork 已支持连接 Google Drive、Gmail、DocuSign、FactSet、Google Calendar、Slack 等多种工具,并随企业版更新一同推出。

这些并非浅层集成。Claude 可以自主完成以下操作:

·在你的 Drive 中检索与浏览文件

·提取并整合多来源数据

·基于获取的信息自动撰写邮件

·对合同进行扫描并标记潜在风险

一旦完成连接,Claude 在每一次会话中都可以直接调用这些工具的实时数据,无需复制粘贴、截图或手动下载。

设置路径:进入 Settings > Connectors,浏览目录(目前已有 50+ 集成),点击「Add」并完成授权即可。

该操作只需执行一次。连接器对所有用户免费开放(包括免费版,自 2 月 24 日起),但目前仍是 Cowork 中最被低估的功能之一。

典型用法示例:

·连接 Slack 后:「检索我过去 7 天的 Slack 消息,汇总需要跟进的事项,并按紧急程度排序。」

·连接 Google Drive 后:「找到我 Drive 中关于某个项目的最新文档,阅读后总结我需要重点关注的三件事。」

·连接 Google Calendar 后:「查看我本周的日程,识别冲突会议,并为优先级最低的一场生成改期邮件。」

Plugins 与 Marketplace

上线时间:2 月 24 日。

插件是为特定岗位预构建的功能模块,将技能、命令(slash commands)与连接器打包为「角色化工具集」。Anthropic 已推出官方插件,覆盖销售、市场、法务、金融、数据分析、产品管理、客户支持、企业搜索、工程、人力资源、运营、设计、品牌、生命科学研究等多个领域。

安装方式:左侧栏 Customize > Browse plugins,点击安装;在对话中输入「/」可查看可用命令。

推荐优先安装的插件:

·Productivity(生产力)

管理任务、日程与日常工作流。输入 /productivity:start,Claude 会自动梳理你当天安排。

·Data Analysis(数据分析)

上传 CSV 文件,输入 /data:explore,Claude 会自动分析字段、识别异常、提出分析建议,并用自然语言生成 SQL。

然后选择一个与你工作匹配的角色插件:

/marketing:draft-content:基于品牌语调生成内容

/sales:call-prep:调研客户并生成沟通要点

/legal:review:审阅合同并标记风险条款

对于团队用户:可以构建私有插件市场,在组织内部统一分发自定义插件,并通过管理员权限进行控制(适用于 Team 与 Enterprise 计划)。一次构建,可在团队内规模化部署。

此外,Anthropic 也推出了公共插件市场与 Ambassador 计划,支持社区开发插件,生态正在快速扩展。

插件还可以进一步个性化:安装后,可以直接对 Claude 说:「根据我的公司情况,帮我定制这个插件。」Claude 会询问你的工作流程、术语体系与偏好,并将这些信息作为该插件的长期上下文。

这意味着,一个通用的销售插件,可以进化为真正理解你目标客户(ICP)、定价体系与沟通风格的专属工具。

Scheduled Tasks

上线时间:2 月 25 日。

你只需一次性设置,Claude 即可按周期自动执行任务,例如:

·每日早晨邮件摘要

·每周五数据指标汇总

·定期竞争情报分析

前提是你的电脑处于开启状态,且 Claude Desktop 正在运行。

一个被多位深度用户验证的真实用例:

让Claude真正替你干活:一份系统配置指南

你在周一早上醒来时,一份已经整理好的简报就躺在那里等你阅读。配合连接器使用,定时任务真正具备了「自动运行」的能力。比如:「每周一,从 #product-feedback 频道抓取所有未读 Slack 消息,按主题分类,并在 Google Drive 中生成总结。」——定时任务自动触发,连接器拉取实时数据,Claude 完成处理,结果直接出现在你的文件夹里。

我自己每天会运行 3–4 个定时任务:早上生成一份 AI 新闻简报并保存到内容文件夹;中午抓取 X 和产品发布信息,做一轮竞品对比;下午整理 Discord 和 Telegram 的社区动态;晚上输出内容表现复盘。

每一个任务都能节省 20–30 分钟的手动操作,加起来接近每天多出两小时的有效时间,而且几乎不需要额外管理成本。

这一功能也伴随着 Claude Desktop 中新的 Customize 模块上线,将技能、插件和连接器统一整合在一个入口中。

Dispatch

上线时间:3 月 17 日。

这是一个打通手机与桌面的桥接能力,目前面向 Pro 和 Max 用户开放。通过 Claude Desktop 或 iOS / Android 客户端,你可以在任意场景下远程管理 Cowork 中的任务。

设置方式很简单:在 Claude Desktop 中进入 Cowork,点击侧边栏的 Dispatch,并开启「Keep awake」(否则电脑进入睡眠后任务会中断)。然后在手机端打开 Claude 应用,在侧边栏点击 Dispatch。

核心体验是:一个跨设备持续同步的对话线程。你在通勤路上,通过手机让 Claude 处理桌面上的任务,例如整理三份表格生成报告;等你到办公室时,结果已经完成。你甚至可以在一条 Dispatch 指令中叠加多个任务,Claude 会在你离开期间按顺序执行。

一个多数人容易忽略的细节(来自 Product Compass 指南):Dispatch 的调度层不会读取你的 CLAUDE.md,它是基于默认假设来生成任务提示的。虽然子任务会读取,但初始指令可能已经存在偏差。

解决方法是:在 Dispatch 指令中显式加入一句:「read CLAUDE.md」。

使用限制与应对:

当前无法在移动端添加连接器

→ 需要提前在桌面端完成 Gmail、Slack、Notion 等连接,Dispatch 会自动继承

当前无法在移动端上传文件

→ 解决方案:将文件发送到邮箱,然后通过 Gmail 连接器让 Claude 读取

整体来看,Dispatch 本质上是在把「本地工作能力」延伸到任意时间与空间。它不只是远程控制,而是在重构任务执行的时间边界。

让Claude真正替你干活:一份系统配置指南

Projects

上线时间:3 月 20 日。

将相关任务组织为持久化工作空间,每个项目拥有独立的文件、链接、指令与记忆。你可以导入现有文件夹,或从零开始创建。这意味着,你可以同时管理多个项目,例如:「Q1 财务报告」与「产品发布资料」,而 Claude 会分别记住各自的上下文。

Projects 的意义在于:将 Cowork 从一次性 Agent 会话,升级为持续演进的工作空间。对于研究密集型任务尤为关键,因为你不再需要在不同对话之间反复丢失上下文、重复解释目标。

Computer Use

上线时间:3 月 23 日

目前为研究预览阶段,仅支持 macOS,面向 Pro 与 Max 用户开放,同时可在 Cowork 与 Claude Code 中使用。

Claude 现在可以直接操作你的电脑:点击、输入、导航界面、打开应用、使用浏览器、填写表单、操作任意本地工具

当存在官方连接器(例如 Slack 或 Google Calendar)时,Claude 会优先使用接口调用;当不存在连接器时,则通过「鼠标 + 键盘」的方式完成操作。

使用机制与风险提示

Claude 在执行关键操作前会请求授权。但 Anthropic 仍建议避免在该模式下处理敏感信息。

需要重点关注的风险是:基于屏幕内容的 prompt 注入。如果 Claude 打开了不可信网站,该页面内容会进入上下文窗口,从而可能影响模型行为。

建议:仅在可信应用与已知网站环境中使用。

结合 Dispatch 的意义

当 Computer Use 与 Dispatch 结合后,能力进一步扩展:你可以在手机上指令 Claude,去完成一个需要操作桌面、浏览器或尚未接入连接器的应用的任务。

本质上,这在打通一个关键能力边界:从「调用工具」,走向「直接操作系统」。

让Claude真正替你干活:一份系统配置指南

Chrome 中的 Claude

Chrome 扩展让 Claude 可以与你并行操作浏览器:读取网页、点击元素、填写表单并完成页面导航。

但真正被多数人忽略的,是以下能力:你可以通过演示一次操作流程,让 Claude 学会复现。任何一项每周重复两次以上的浏览器任务,都可以被记录为一个工作流。

与 Claude Code 的集成则进一步打通开发流程:你可以在终端编写代码,同时在浏览器中实时测试。扩展可以读取控制台报错、网络请求以及 DOM 状态,因此当你的前端出现问题时,Claude 往往在你提问之前就已经定位原因。

此外,你还可以直接在 Claude Desktop 中控制浏览器操作,无需频繁切换窗口。对于 Team 和 Enterprise 用户,管理员可以在组织层面统一管理扩展,通过白名单与黑名单控制可访问的网站。

一个典型应用场景是:将「每周查看竞品定价页面」这一流程录制为工作流。Claude 会自动访问各个网站,抓取价格信息,并整理进 Cowork 文件夹中的对比表。原本需要 45 分钟反复点击的工作,可以压缩为一次点击复用。

需要注意的是:应谨慎授权网站访问权限。网页内容是 prompt 注入的主要入口之一,应尽量限制在可信站点范围内。

使用边界

整理过去数月积累的文件:

将 Cowork 指向一个包含过去 6 个月杂乱文件的文件夹——包括收据、合同、笔记、截图等。

让Claude真正替你干活:一份系统配置指南

Claude 会逐个读取文件,完成分类、按日期重命名、建立文件结构,并生成操作日志。原本需要 2 小时的整理工作,可以压缩到 10 分钟完成。

有用户用 Cowork 对 317 个迪士尼世界的视频进行整理:Claude 从视频元数据中提取 GPS 坐标,判断每个视频对应的园区位置,并据此自动归类到不同文件夹中。

让Claude真正替你干活:一份系统配置指南

让Claude真正替你干活:一份系统配置指南

Lenny 让它遍历自己所有的播客内容(数百期),并自动提取出关键信息,比如「最重要的产品经验」和「最反直觉的洞察」。整个过程在几分钟内完成,而这种工作过去可能需要数天甚至数周。相关阅读

从原始材料生成客户交付成果:你手里有会议纪要、一份逐字稿,以及一些研究链接,现在需要整理出一份结构完整、可直接对外提交的报告。

让Claude真正替你干活:一份系统配置指南

Claude 会读取你所有的原始材料,将其整合为一份结构化报告,按照你的模板完成格式排版,并直接保存为可发送版本。原本需要 90 分钟的工作,可以压缩到 15 分钟完成。

自动化的每周研究简报:你可以设置一个用于竞争情报的定时任务。每周一早上 7 点,Cowork 会自动调研竞争对手、扫描行业出版物,并生成一份格式化的简报。你只需在方便的时候进行审阅。结合连接器,还可以从 Slack、Gmail 和 Drive 中调取实时数据。

财务建模:有创作者曾让 Cowork 构建一个社交媒体退出估值模型。Claude 会自行制定方案、自行发现公式错误并修正,最终交付一份「华尔街风格」的 Excel 文件,包含四种估值方法、共 129 个公式。综合估值区间覆盖:收入倍数、EBITDA 倍数、用户/订阅价值,以及 5 年期 DCF 模型。坦率说,这已经相当惊人。

局限性

Cowork 的消耗速度很快。

一次复杂任务,可能会消耗相当于数十次普通对话的额度。在 Pro(20 美元/月)套餐下,如果你每天使用,通常一周内就会触及限制。社区反馈显示,重度用户在 3–4 天内就会遇到速率限制,如果正处于关键任务阶段,这会非常影响体验。

多步骤任务(如文件读取、文档生成、并行子任务)本质上计算密集。如果 Cowork 成为你的主要工作流,Max(100 美元/月,对应约 5 倍额度;或 200 美元/月,对应约 20 倍额度)更具可行性。建议通过 Settings > Usage 实时监控使用情况,避免任务中途被中断。

长会话中的上下文压缩问题也不可忽视。当会话接近上下文上限时,Claude 会自动对早期内容进行摘要压缩,以释放空间。虽然可以维持会话继续运行,但代价是信息精度下降:数值被简化、文件引用变得模糊、早期决策被压缩成概括性描述

如果你发现 Claude 开始用「常见模式」而不是具体文件来回答,说明压缩已经发生。解决方法是,在关键节点,让 Claude 将重要信息写入文件保存。这样即使上下文被压缩,关键信息仍然可追溯。

当前仍处于研究预览阶段。Anthropic 也明确说明:模型仍可能误读文件,或在简单问题上采取不必要的复杂路径。在复杂多步骤任务中,大约有 10% 的概率会出现偏离预期的执行路径,最终结果中可能存在局部不一致。因此,对外输出前必须进行人工复核。

跨会话无记忆。每一次新的 Cowork 会话都是完全独立的:不记得你是谁,