Agent 记忆五层模型与工程落地
Agent 记忆五层模型与工程落地对话式大模型 Agent 的「记忆」问题,本质就是:如何让机器像人一样,不只是即时回答,而是能记住过去、理解现在、影响未来。过去两年,学术界和工业界已经逐渐形成一个共识:记忆需要分层,不同层次解决不同问题。下面我用一个五层模型,带你快速建立完整认知。 TL;DRAgent Memory 的五层模型,就像人类大脑的结构化记忆系统。 工作记忆负责即时 情景记忆负责事件 语义记忆负责知识 程序性记忆负责技能 外部持久记忆负责归档 业界工程实践已经逐步达成共识:分层 + 策略化 + 可控。这是未来对话式 Agent 真正“有记忆力”的基础。 1. 工作记忆(Working Memory) 定义:Agent 当前正在处理的上下文,类似人类的「短时记忆」。 特点:存活时间短、容量有限,常常就是一段对话上下文窗口。 类比:你在和朋友聊天时,能记住刚才说的两三句话。 实现方式: LLM prompt 窗口(context window) Scratchpad 技巧(中间步骤写出来) 代表案例:LangChain 的...
🌅 22 个顶级 Agent 工作流框架整理
最近在做一个新的独立开发产品,核心功能里涉及到 多智能体协作。在调研阶段,我发现相关框架和工具特别多:有的强调团队角色分工,有的走可视化无代码路线,还有的专注研究“涌现行为”。于是我干脆整理了一份 Agent 框架全景图,按时间和特点做了分类。如果要做 B2B/B2C 的 Agent 产品,可以判断该走 可视化无代码(Flowise、n8n)、多角色分工(Meta-GPT、ChatDev)、还是 通用框架(AutoGen、Agno、CrewAI)路线。结合框架生态热度(Star 数、厂商背景)做市场判断,避免选型踩坑。 AgentUniverse(2023,开源 1.6k⭐):支持多智能体协作,具备完整的规划、工具使用和内存管理能力,部署以本地为主,角色定义包括 PEER、DOE 等。Agentverse(2023,开源 4.7k⭐):聚焦多智能体协同与涌现行为,角色涵盖专家、决策者等,采用基于阶段的控制流架构,支持跨平台部署。Agno(2024,开源 32.5k⭐):轻量级多模态智能体框架,支持 “团队模式” 的多智能体协作,采用混合流(数据 +...
从 Claude Code 学的 6 个设计铁律(含 prompts/tool 清单)
TL;DRClaude Code 之所以“顺滑”,核心不是模型,而是架构和设计哲学。 6 条可以直接迁移到你自己 Agent 的铁律: 保持单一主循环 —— 一条主 loop,最多一条分支,调试优先。 小模型,大闭环 —— 80% 的读/扫/总结都交给小模型,关键时刻才用大模型。 上下文文件(claude.md) —— 用一个 context 文件固化团队约定与偏好。 LLM Search 胜于 RAG —— 用 ripgrep/jq/find + LLM,而不是复杂的向量检索。 分层工具设计 —— 高频动作单独做工具,低频留给 Bash,高层工具保证 determinism。 显式 To-Do 清单 —— 让模型自己维护待办,防止长会话跑偏。 一、保持单一主循环我看到很多人做 Agent 时,喜欢搞多智能体、复杂 orchestrator。结果是:看 demo 很炫,真要调试时一团糟。Claude Code 完全反其道而行之:一条主循环,最多一条分支。 它的策略是:如果遇到复杂任务,就 spawn...
2025/08 Review
早早交付,经常交付
构建 Agent 中的方法论陷阱
看似聪明的 Agent 方法论,可能是陷阱。少即是多。
48 小时小工具实录:我做了个大会助手
起心动念周一晚上,本来想早点休息,结果脑子突然冒出个念头: “要是有个离线可用、免登录的大会日程助手就好了。” 于是干脆一口气写了 5 个小时,把一个可用版本搞了出来。核心约束很明确:免登录、离线、轻交互。目标很单纯,就是现场能救急。 临时开工整个技术方案非常 indie: React + PWA + Vercel 一键部署 数据靠 GPT 整理的大会官网,然后导入 JSON 没有后台,没有账号,全在前端跑 代码写得像夜宵拼盘,能跑就行。为什么选纯前端?为了离线和快速交付。上线第一天就接到 iOS 用户反馈打不开,着急忙慌修问题,才发现自己紧急开发没有充分测试设备的问题。那一晚边修边想:“这样上线真的有人用吗?” 上线与运营周二白天,我赶紧补了点运营内容。发到 v2ex,几乎没人理;同时小红书,反而慢慢起来了。陆陆续续有人私信问“怎么用”,我只好一边当客服一边补文案。没想到借着这件事,还面基了不少人。 这让我意识到:即便是独立开发的小工具,找到合适的分发渠道也比想象中重要。 两天的数据 结果出来后有点意外: 76 位用户 841 次访问 平均使用时长 2 分...
2025/07 Review
你不应先学习,再开始;而应先开始,再学习。
2025/06 Review
自我实现是一个持续发生的过程。它意味着,每一次都在诚实与欺瞒、正义与偷懒之间做出选择;意味着让每一次选择,都成为成长的机会。
2025/05 Review
我不是一个乐观主义者,我只是一个非常严肃的可能主义者。
2025/04 Review
糊涂塌客虽然是只小鸟,但却有旺盛的斗志。(づ′▽`)づ