从 Claude Code 学的 6 个设计铁律（含 prompts/tool 清单）

TL;DR

Claude Code 之所以“顺滑”，核心不是模型，而是架构和设计哲学。
6 条可以直接迁移到你自己 Agent 的铁律：

我看到很多人做 Agent 时，喜欢搞多智能体、复杂 orchestrator。结果是：看 demo 很炫，真要调试时一团糟。Claude Code 完全反其道而行之：一条主循环，最多一条分支。

它的策略是：如果遇到复杂任务，就 spawn 一个“子自己”，最多一层，跑完再把结果写回消息历史。好处是整个控制流一目了然，出错时能很快定位。

经验教训：debuggability > 架构炫技。

Claude Code 超过一半的调用走的都是 Haiku（小模型），用来读文件、parse JSON、总结 git 历史。只有关键生成（比如复杂编辑）才用大模型。
这有两个好处：

Claude Code 的另一个 killer feature 是 claude.md。它是一个上下文文件，写清楚所有人类无法从代码直接推断出的规则：

哪些目录要忽略
用哪些库
代码风格/注释习惯
每次请求都会把 claude.md 附上。效果非常明显：有和没有，差距是天与地。
如果你做自己的 Agent，可以试着加个 agent.md，让它成为团队偏好的“单一真相源”。

Claude Code 在搜索上做了一个非常“逆潮流”的选择：不用 RAG。
它直接让模型写 ripgrep/jq/find，就像你在终端里手敲一样。模型理解代码和正则，足以定位绝大多数问题。

为什么这样更好？因为 RAG 有很多隐形失效点（相似度函数、chunk 粒度、reranker…），而 LLM Search 可见、可调试。

我现在越来越相信：别急着上 RAG，先让模型像人一样搜索。

Claude Code 的工具集很讲究层次感：

这点给我的启发是：设计工具时不要贪心，把 agent 最容易用错/用频繁的动作，做成独立工具。

长会话的一个大坑是“上下文腐烂”。Claude Code 的解法是：让模型自己维护 To-Do list。
它会频繁检查和更新 To-Do，这样就能保持方向一致，还能在中途插入/删除子任务。
相比多 agent 接力，这种方式简单、直观，而且能充分利用 LLM 的“边想边写”能力。

Claude Code 的核心提示：太长评论留下邮箱，我会定期回复

Claude Code 的核心 Tools 提示：太长评论留下邮箱，我会定期回复

Claude Code 的 prompt 工程很值得参考：

工具方面，它的必备集包括：