Luhui's Personal Website

2025/10 Review

发表于2025-11-01

炉要小，火要旺

AI 如何自主管理记忆？三种前沿架构详解 A-MEM / Mem-α / Mem0

发表于2025-10-31

引言：AI 的记忆问题我们常常说 AI 越来越像人类，但在“记忆”这一环节，现有的系统仍然远未达到真正的类人能力。在之前的文章《Agent 如何避免记忆漂移：三大策略与工程实践》中，我们讨论了如何设计一个稳定且高效的记忆系统，并分享了三大策略帮助解决记忆一致性和长期记忆问题。然而，这些策略多侧重于工程实践，强调了如何避免记忆的失真、漂移和过度遗忘。今天，我们要深入探讨一个更前沿的课题：AI 如何自主决定自己的记忆？这一问题不仅挑战了传统的记忆存储方式，也为智能系统提供了更高的灵活性和自适应能力。通过 AI 系统根据任务需求和经验，自主更新和优化记忆，AI 可以更智能地应对复杂的任务。在这篇文章中，我们将介绍三种突破性的记忆管理方案——A-MEM、Mem-α 和 Mem0，并讨论它们如何通过创新的记忆架构，推动 AI 系统在长期任务中的表现。记忆管理的基本概念在深入这三种方案之前，我们先简单回顾一下 AI 记忆管理的基本概念。通常，AI 系统的记忆可以分为两大类：工作记忆类似于人类的短期记忆，用于存储和处理当前任务的信息。它是即时性的，帮助...

了解和 AI 对话时真正发生了什么（你可能一直理解错了）

发表于2025-10-29

你可能也有过这个体验：打开豆包、腾讯元宝或者 ChatGPT，输入一句话，它“立刻开始打字”，像一个反应敏捷的朋友，甚至比人类还懂得如何接话、如何幽默。在绝大多数人心里，这是“像一个人一样在聊”。但你知道吗？技术视角看到的完全不是“对话”，而是一套被精准触发的工业级装配流程。你看到的是“对话感”，系统看到的是“请求处理管线”我们以最常见的一句自然问话为例： “可以帮我整理成一份可以发给团队的正式总结吗？” 你觉得它马上开始“思考并组织语言”，但实际上它做的是一串极其严格、完全程序化的流程： ① 接收到请求 → ② 安全扫描 → ③ 构建上下文窗口 → ④ 文本切割成 Token → ⑤ 开始预测第一个 Token ⑥ 一边预测一边实时往回流（你看到的“正在输入…”）→ ⑦ （如需要）中途调用某个外部工具 → 再继续生成这几乎和流水线制造一台 iPhone...

Agent Memory 评估测试方案：从指标体系到开源基准

发表于2025-10-24

给那些正在构建智能体的开发者的一份记忆体检指南前段时间，我在调试一个几何 Agent。这个 Agent 能自动分析几何题、推理定理、调用绘图工具，看上去颇有点“自主学习”的影子。但问题也随之而来——它太健忘了。有时候明明刚在上文证明过某个结论，下一步又开始怀疑它自己。我给它接上了向量数据库、加了摘要器、甚至写了个小型索引器，但效果依旧不稳定。那时候我开始意识到：我们都在拼命强化 Agent 的“行动力”，却很少认真测量它的“记忆力”。于是我决定系统地研究一下，怎么评估一个 Agent 的 Memory 模块。今天这篇文章，写给所有已经或准备构建 Agent 工程的人。希望帮你找到一套可落地、可复现的记忆评测方案。为什么要测记忆？如果说大模型是 Agent 的大脑，那 Memory 就是它的长期神经系统。没有记忆，再聪明的模型也只能“现想”而无法“积累”。在工程实践里，这会表现为：对话几轮后开始失忆任务中重复提问自相矛盾的人设一旦上下文超过 10K，就变成另一位陌生 AI 在我构建数学 Agent...

Agent 如何避免记忆漂移：三大策略与工程实践

发表于2025-10-17

TL;DR长期运行的 Agent 容易出现「记忆漂移」：随着时间推移，其记忆内容被反复重写、压缩、整合，逐渐偏离原始语义，进而导致自相矛盾、逻辑错乱或行为失常。本篇文章总结了三种抵御记忆漂移的核心策略：定期总结：定时摘要长对话内容，减少信息积压，保持上下文可控批处理蒸馏：从多轮对话中提炼出用户偏好与抽象知识，提升记忆质量冲突合并：发现重复或冲突内容，统一更新或标记失效，维持一致性结合实际系统如 MemGPT、AWS AgentCore、LangChain 等，下文提供了对应的工程实现与开源项目指引，适合构建具备长期稳定记忆的 Agent 架构。引言：智能体的「记忆漂移」现象在构建具备长期行为一致性与任务连贯性的智能体（Agent）时，「记忆」机制成为不可或缺的一环。与静态函数调用或短程上下文不同，Agent 的长期记忆的目标是支持跨轮次对话、持续学习与经验积累。然而，随着记忆体量增长，「记忆漂移」问题逐渐显现：原始信息在多次重写、压缩、提取过程中偏离原意，导致 Agent...

什么是多 Agent 系统？从单体模型到协作智能的进化

发表于2025-10-15

过去一年，我们见证了无数“大模型”带来的奇迹。它们能写代码、能画图、能写策划书，甚至能帮你找 bug。于是一个问题出现了：既然大模型已经这么强了，为什么还要搞那么复杂的「多 Agent 系统」？是不是就是多开几个大模型？其实，多 Agent 不是“堆模型”，而是一次智能结构的转变。它让我们开始用「团队」的方式去理解 AI，让语言模型从“单人作坊”变成“协作组织”。一个 Agent 不够用吗？想象你让 GPT 帮你开发一个网站：它能写前端，也能设计数据库，还能生成测试代码。但很快你会发现一个问题，它在写完后自测永远都通过，逻辑错误自己也检查不出来。于是人们开始尝试：让一个 GPT 写，另一个 GPT 审；让一个负责规划，另一个负责执行；甚至让两个 GPT 吵一架，看谁的结论更靠谱。这就是最早的 “multi-agent” 思想萌芽。不是因为模型不行，而是因为智能需要结构。单个 Agent 再强，也无法同时兼顾规划、执行、评估、反思这些不同心智功能。为什么要多个...

什么是 Agent Memory？探索 AI 如何理解并记住你的话

发表于2025-10-10

记忆并非理所当然，理解 AI 时代的记忆记忆是我们日常生活中不可或缺的一部分。从小到大，我们积累的经验和知识形成了对世界的认知框架。人类的记忆帮助我们在面对未知时作出反应，记住重要的事情，避免重复犯错。但是，如果我们只将记忆理解为人类自然存在的生理过程，那么在面对人工智能（AI）时代的 Agent Memory 时，可能会产生误解。在 AI 的世界里，记忆并不像人类那样自然而然地存在。这也是为什么我们需要从一个全新的角度，去理解和探索 Agent Memory —— 它不仅仅是记住过去的互动，而是让机器能够像人类一样，通过记忆优化每次决策的能力。通过这篇文章，我将带你走进 Agent Memory 的世界，解答这个关键问题： Agent Memory 是什么？为什么它对智能代理至关重要？什么是 Agent Memory？Agent Memory 是人工智能代理（AI Agent）中的“记忆系统”，它是人类设计的存储、更新/遗忘和检索机制。它使得 AI...

Agent 记忆检索策略：怎样学会想起？

发表于2025-10-08

TL;DRLLM Agent 的记忆系统关键不在“能记多少”，而在“能否精准想起”。本文总结了三类触发机制与六种检索策略，构成了一个从“何时想起”到“如何检索”的完整框架： 🧠 触发机制（When to Recall）规则触发 —— 窗口容量不足时检索历史反思触发 —— 模型自觉遗忘时主动检索事件触发 —— 特定情境或失败日志触发回忆 🔍 检索策略（How to Retrieve）语义相似检索混合检索图式检索元数据过滤重排反思式检索这些策略共同构成了 RAG（Retrieval-Augmented Generation）的多种实现形态，从简单的语义召回到带有反思与路由能力的自适应检索。记忆不是仓库，而是过滤器——检索策略定义了 Agent 的注意力边界，也塑造了它的“思考深度”。前言LLM Agent 记忆系统的挑战不在“能存多少”，而在“能否精准想起”。AutoGPT 曾经尝试将所有任务摘要向量化存入 Pinecone，但检索常常召回“语义相似但任务无关”的记录。Voyager 在 Minecraft...

把 MCP 放回它该在的位置

发表于2025-10-03

前阵子有朋友问我： “Agent 和 MCP 到底有什么区别啊？” 我当时愣了一下。这问题乍听很简单，甚至让人觉得是不是在“混淆概念”。但转念一想，没错啊。对于刚入行的人来说，各种 buzzword 像弹幕一样飞来，Agent、MCP、RAG、LangChain……乍一看都差不多，背后却完全不是一回事。我决定写下这篇文章。不是为了定义概念，而是想把它们放回该在的位置。这样以后遇到选择，就不会懵逼。 Agent 是人，MCP 是语言如果把 Agent 比作一个人：眼睛耳朵是感知（输入）大脑是认知与推理（记忆、判断）决定去做什么是决策动手去做是执行事后总结经验是反馈而 MCP 呢？它不是另一个“大脑”，而是这人和外部世界说话时，用的通用语言。 Agent 想用锤子、笔记本、数据库……如果没有通用语言，就只能每次“手舞足蹈”解释一遍。但有了 MCP，像插 USB 一样——对接标准统一了，沟通就不再痛苦。三种方式接工具作为开发者，我自己踩过的坑大概分三种：直连...

2025/09 Review

发表于2025-10-02

鸟站在枝头宁静安详，不是因为它知道树枝不会断，而是因为它知道自己有翅膀。