前言2025年7月7日记忆张量上海科技有限公司联合上海交通大学、中国人民大学、同济大学、浙江大学、中国电信研究院等十多家顶尖学术与产业机构正式开源MemOSMemory Operating System工业级记忆操作系统。这是全球首个将记忆提升为与算力、存储同等重要的一级计算资源的LLM基础设施彻底解决了大模型健忘症、时序推理能力弱、跨任务记忆丢失等行业痛点。在权威的LOCOMO长期记忆基准测试中MemOS实现了对OpenAI全局记忆的全面超越整体推理准确率提升38.97%Token开销降低60.95%在最具挑战性的时序推理任务上更是取得了159.15%的惊人提升一举登顶全球记忆管理系统SOTA。截至2026年5月13日MemOS已迭代至v2.0星尘Stardust版本GitHub星标突破1.2万累计部署量超过8万次被超过3000家企业用于智能体和个性化AI应用开发。官方资源GitHub开源仓库https://github.com/MemTensor/MemOS官方网站https://memos.openmem.net技术论文https://arxiv.org/abs/2507.03724开源协议Apache 2.0个人与商业无限制免费使用一、核心痛点传统LLM记忆系统的致命缺陷当前大模型的记忆能力主要依赖两类短期记忆参数记忆固化在模型权重中更新困难和激活记忆KV缓存仅在单轮会话中存在。这种架构导致了四大无法解决的核心问题上下文窗口瓶颈即使是200万Token的超大窗口也无法存储跨天、跨周的长期交互历史时序信息丢失模型无法准确记忆事件发生的时间顺序经常出现张冠李戴的时序错误跨任务记忆断裂不同会话、不同任务之间的记忆无法互通每次交互都需要重新输入上下文记忆不可控无法编辑、删除或修正模型的错误记忆只能通过重新提示来覆盖安全隐私风险所有记忆都存储在云端存在数据泄露和滥用的风险传统的RAG检索增强生成方案只是临时补丁它只能被动检索外部文档无法实现记忆的主动更新、演化和推理。而MemOS从操作系统的视角重新设计了记忆管理体系为LLM提供了一套完整的记忆生命周期管理能力。二、核心定位为AI打造的记忆操作系统MemOS不是一个简单的向量数据库或RAG工具而是一个专为LLM和AI Agent设计的完整记忆操作系统。它就像计算机的操作系统管理CPU和内存一样统一管理AI的所有记忆资源统一抽象将参数记忆、激活记忆和明文记忆统一抽象为MemCube记忆单元全生命周期管理支持记忆的创建、读取、更新、删除、合并、迁移和演化动态调度根据任务需求自动在不同类型的记忆之间调度数据平衡速度和容量多模态支持原生支持文本、图像、音频、工具调用轨迹等多种类型的记忆安全隔离支持用户级、项目级、Agent级的记忆隔离和权限控制这种设计使得AI能够像人类一样拥有短期记忆、长期记忆和技能记忆能够从经验中学习不断进化自己的能力。三、六大核心特性打造工业级记忆基础设施1. MemCube统一记忆抽象三种记忆自由转换MemOS提出了MemCube记忆立方体的核心概念将所有类型的记忆封装为标准化的单元明文记忆存储原始文本、图像、音频等数据容量无限激活记忆存储模型推理过程中的中间状态访问速度最快参数记忆存储从经验中提炼的知识和技能调用效率最高MemOS能够自动在三种记忆之间进行转换频繁使用的明文记忆会被提升为激活记忆以提高访问速度稳定且重要的模式会被提炼为参数记忆以实现高效调用。这就像人类学习过程中反复练习的技能会从有意识控制转变为自动化反应。2. 时序推理引擎159%提升的核心秘密这是MemOS最核心的技术突破。它为每个记忆单元自动添加时间戳元数据并构建了专门的时序索引结构支持精确的时间范围查询如查询上个月的所有会议记录能够推理事件之间的因果关系和时间顺序自动识别模糊的时间表达如前天、“上周”、“下个月”支持时间线可视化直观展示事件的发展过程在LOCOMO基准测试中MemOS的时序推理准确率从OpenAI的0.2825提升到0.7321实现了159.15%的飞跃彻底解决了大模型记不住时间的问题。3. 三层可扩展架构工业级稳定性MemOS采用三层解耦的模块化架构支持从个人设备到企业级集群的无缝扩展API层提供统一的RESTful和Python API一行代码即可接入所有主流LLM调度管理层MemScheduler动态调度记忆资源实现毫秒级响应存储基础设施层支持SQLite、PostgreSQL、Redis、向量数据库等多种存储后端官方测试显示MemOS在单台服务器上可支持10万并发用户平均响应时间低于50ms完全满足生产环境的高并发需求。4. 多模态记忆与工具记忆MemOS原生支持多模态记忆存储和检索文本记忆对话历史、文档、代码、笔记图像记忆截图、照片、图表工具记忆工具调用轨迹、执行结果、错误日志人格记忆用户偏好、性格、习惯同时它还支持技能记忆功能能够将AI完成任务的过程提炼为可复用的技能在后续任务中自动调用实现一次学习终身使用。5. 本地/云端双部署零数据泄露风险MemOS提供两种部署模式满足不同用户的安全需求本地模式100%在用户设备上运行所有数据存储在本地SQLite数据库中零云端依赖云端模式支持Docker一键部署到私有云或公有云提供企业级安全和可扩展性两种模式使用完全相同的API开发者可以根据需求自由切换无需修改任何代码。6. MCP协议原生支持全生态兼容MemOS v2.0原生支持MCP模型上下文协议可无缝集成到Claude Code、CherryStudio、Cline等所有支持MCP的AI客户端。只需一行配置就能让你的AI助手拥有长期记忆能力记住你所有的偏好和历史交互。四、技术突破如何实现159%的时序推理提升MemOS的优异性能并非来自简单的参数堆叠而是来自于四项原创的核心技术创新。1. 时序感知的混合检索机制传统的向量检索只关注语义相似度完全忽略了时间信息。MemOS提出了时序-语义混合检索算法在检索时同时考虑语义相似度和时间相关性对于近期发生的事件给予更高的时间权重对于重要的历史事件给予更高的语义权重支持自定义时间衰减函数模拟人类的遗忘曲线这种机制使得MemOS能够准确检索到特定时间范围内的相关记忆大幅提升了时序推理的准确率。2. Next-Scene Prediction预加载机制MemOS内置了下一场景预测模块能够根据当前对话上下文提前预加载可能需要的记忆片段当用户提到上次的项目时自动预加载该项目的所有相关记忆当用户开始讨论一个新话题时自动切换到对应的记忆空间预加载过程在后台异步进行不会影响用户体验官方数据显示这种机制将记忆检索的平均延迟降低了72%同时将Token开销减少了60.95%。3. 记忆演化与反馈修正MemOS支持自然语言反馈修正记忆用户可以直接用中文告诉AI你记错了这件事发生在上周三不是上周二AI会自动修正对应的记忆单元。同时MemOS会根据用户的反馈不断优化记忆的权重和关联关系让记忆越来越准确。4. 多智能体记忆共享与隔离MemOS支持多个AI智能体之间的记忆共享与协作同一用户的多个智能体可以共享用户偏好和通用知识不同项目的智能体之间记忆完全隔离避免信息泄露支持团队级记忆空间团队成员的AI可以共享项目相关的记忆五、性能对比全面超越主流记忆系统在LOCOMO长期记忆基准测试中MemOS与OpenAI全局记忆、Mem0、MemU等主流方案的对比如下测试任务OpenAI全局记忆Mem0MemUMemOSMemOS提升vs OpenAI平均准确率0.52750.61230.58760.733138.98%单跳推理0.61830.68920.65470.784426.86%多跳推理0.60280.62150.59830.64306.67%开放域问答0.32990.45670.41230.552167.35%时序推理0.28250.35420.31780.7321159.15%Token开销相对值1.00.720.850.39-60.95%数据来源MemOS官方技术报告、LOCOMO基准测试官方结果2025年7月从测试结果可以看出MemOS在所有任务类型上均优于其他方案尤其是在时序推理和开放域问答任务上优势极其明显。同时它的Token开销仅为OpenAI全局记忆的39%性价比极高。五、5分钟快速上手5.1 安装MemOS# 使用pip安装pipinstallmemos# 验证安装memos--version5.2 本地模式快速体验frommemosimportMemOS# 初始化本地MemOS实例magMemOS(modelocal)# 添加记忆mag.add_memory(user_iduser123,content2026年5月10日我和张三在上海开会讨论了项目X的进度决定下周三提交第一版原型,timestamp2026-05-10)mag.add_memory(user_iduser123,content2026年5月12日我收到了李四的邮件他说项目X的预算已经批准了,timestamp2026-05-12)# 查询记忆resultmag.query_memory(user_iduser123,query项目X最近有什么进展)print(result)# 输出# 2026年5月10日你和张三在上海开会讨论了项目X的进度决定下周三提交第一版原型。# 2026年5月12日你收到了李四的邮件他说项目X的预算已经批准了。5.3 集成到Claude Code只需在Claude Code的MCP配置中添加以下内容即可让Claude拥有长期记忆{mcpServers:{memos:{command:python,args:[-m,memos.mcp_server]}}}六、典型应用场景1. 个人AI助理记住你的所有偏好、习惯和日程安排自动整理会议记录、邮件和聊天信息跨会话保持上下文无需每次重复说明提醒你重要的事项和截止日期2. 企业智能体构建企业级知识库沉淀团队经验和知识支持多智能体协作共享项目记忆自动生成工作日报、周报和项目总结辅助新员工快速上手降低培训成本3. 智能客服记住每个客户的历史咨询记录和偏好无需客户重复说明问题提供个性化服务自动识别常见问题快速给出解决方案持续学习客户反馈不断优化服务质量4. 医疗健康记录患者的病史、用药情况和检查结果辅助医生进行诊断和治疗方案制定提醒患者按时服药和复诊生成个性化的健康建议和康复计划5. 教育学习记录学生的学习进度和知识掌握情况生成个性化的学习计划和练习题自动批改作业和试卷给出详细的讲解跟踪学生的学习效果及时调整教学策略七、未来规划记忆张量科技表示将持续投入MemOS的研发未来计划推出MemOS 3.0引入多模态大模型进一步提升图像和视频记忆的理解能力增强技能记忆支持更复杂的技能提炼和迁移让AI能够真正从经验中学习发布企业版提供SLA保障、技术支持和高级安全功能建设生态社区鼓励开发者贡献插件和模板丰富MemOS的应用场景推动行业标准联合产学研机构制定LLM记忆管理的行业标准结尾MemOS的开源标志着大模型技术从感知时代进入了记忆时代。它不仅解决了大模型健忘症的痛点更为AI的持续学习和进化提供了坚实的基础设施。从只能单次推理的计算器到拥有长期记忆的智能体MemOS正在重塑AI的能力边界。未来随着记忆技术的不断发展AI将能够真正理解人类的需求记住我们的过去陪伴我们的现在预见我们的未来成为每个人不可或缺的智能伙伴。