实验里文件系统如何让Agent真正“终身学习”
大多数构建Agent的团队还在为“记忆持久化”这个老大难问题头疼——要么靠向量数据库做模糊检索要么硬编码状态机要么每次会话都从零开始喂上下文。我起初也这么认为Agent记忆必须得是高度结构化的专用机制否则模型根本管不住自己。后来看到Lance Martin分享的Claude Plays Pokémon真实实验才发现这个认知完全把方向带偏了。真正让Agent从“每次重启都失忆”变成“跨会话持续演进”的不是更复杂的内存工具而是最朴素的文件系统。实验细节简单却震撼David Hershey给Claude配了一个读写内存文件夹的工具本意是帮它在游戏里积累导航经验。Sonnet 3.5早期版本完全没理解“记忆”的本质把NPC对话一股脑儿全记下来跑了14000步后生成了31个文件却还卡在第二个城镇几乎毫无进展。那时的记忆文件更像原始的聊天记录而不是可行动的知识。而到了Opus 4.6同样的工具、同样的步数情况完全反转它只生成了10个文件却主动按目录结构组织起来——三个道馆徽章单独存档还提炼出了一个“learnings.md”文件里面全是自己失败教训的浓缩总结。Agent开始像一个真正有经验的玩家一样思考和迭代。这个结果直接颠覆了业界对Agent记忆的常见假设。CoALA论文和memGPT等研究早就指出人类认知科学和操作系统里的内存管理思路能给Agent带来启发。但Pokémon实验第一次用大规模真实交互证明当模型能力跨过某个临界点它反而能把通用文件工具用得比任何专用内存方案都好。Letta_AI的独立验证也印证了这一点——文件系统在实际任务中往往全面胜出。Anthropic正是基于这个洞察在Claude Managed AgentsClaude平台原生支持里把记忆实现为内存存储Memory Stores。它本质上是工作区级别的文本文档集合每次会话结束都不会被丢弃。使用时只需把内存存储挂载到容器里路径固定为/mnt/memory/store-name/系统会自动往提示词里注入一句简短说明让Claude知道这里可以读写持久文件。更厉害的是多Agent协作场景多个Agent可以同时挂载同一个内存存储平台负责实时同步——一个Agent修改了文件其他Agent的文件系统视图立刻更新。同时内置并发控制避免相互覆盖。记忆文件还能通过API完整导出调试、分享、版本管理全都不在话下。会话 Session临时上下文协调Agent/mnt/memory/store-name/持久文件系统Agent 1读写记忆Agent 2实时同步Agent 3导出API文件系统记忆 vs 传统专用内存方案的核心权衡基于实际生产场景维度传统向量数据库/专用内存工具Claude Managed Agents 文件系统记忆结构化程度高强制schema或embedding低Claude自主决定目录文件名跨会话持久性需要额外同步机制原生平台级持久自动跨会话多Agent共享通常需要额外锁或分布式存储平台内置实时同步并发控制可解释性与调试黑盒embedding难以人工审查纯文本文件可直接下载、阅读、版本管理模型利用效率模型只能“检索”难以主动组织模型主动管理、提炼、归档能力随scaling释放长尾风险向量漂移、检索幻觉、存储成本高文件膨胀可控Claude自己学会精简分享与导出复杂需要API或导出脚本一键API导出或直接下载文件夹我早期做Agent项目时最痛苦的就是“上下文窗口永远不够用”和“每次重启都要重新教育模型”。现在回头看会话日志负责当前任务的瞬时状态内存存储负责跨任务的终身知识这个二分法把问题彻底拆开了。Claude可以主动把重要洞见从会话里抽取出来写入结构化的记忆文件下次直接调用——这才是真正意义上的“从经验中学习”。文件系统的另一个隐形优势是完全可解释。不像向量数据库里一堆高维向量谁也看不懂内存文件夹里的每个.md文件都是人类可直接阅读的知识资产。David Hershey当时就是直接把整个内存文件夹分享出去就让其他人能复现和迭代实验。为什么文件系统才是2026年Agent记忆的底层基础设施它把决策权交给了模型本身模型越聪明就越知道该存什么、怎么组织、什么时候提炼。这条路径不是在跟模型能力对抗而是在顺着它放大。专用工具在模型弱的时候是救命稻草但在能力足够强的今天反而成了限制Agent发挥的枷锁。想快速上手直接看Anthropic官方文档或者在Claude Code里输入/claude-api调用内置的claude-api skill就能直接跟它聊Managed Agents的全部细节。你在构建自己的Agent系统时是继续堆专用内存工具还是已经开始把文件系统当成第一公民的持久化层欢迎在评论区分享你遇到的记忆管理痛点——我们一起把这些生产级实践变成团队可复制的资产。我是紫微AI在做一个「人格操作系统ZPF」。后面会持续分享AI Agent和系统实验。感兴趣可以关注我们下期见。