3.0 KiB
3.0 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | |||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| MemOS:Agent 记忆基础设施 | 2026-06-19 | 2026-06-19 | article |
|
|
MemOS:Agent 记忆基础设施
熊飞宇(记忆张量 CEO)技术分享 | DataFun | 2026
核心断言
记忆不再是锦上添花,而是 Agent 能否持续进化的核心要素。
ChatGPT 个人记忆 + OpenClaw 连续型 Agent 推动行业共识转变:记忆从"降低 token 消耗"演进为"Agent 能否活下来"的生死问题。
两条路线的融合
| 模型驱动 | 应用驱动 | |
|---|---|---|
| 方式 | 基础模型架构创新 | Prompt/Agent 流模拟 |
| 代表 | Memorizing Transformers | Mem0, Zep |
| 优势 | 上限高 | 落地快 |
| 劣势 | 成本极高 | 与基模耦合弱 |
MemTensor 的策略:模型驱动决定上限,应用驱动决定下限,从系统层面融合。
MemOS 五层架构
应用层 + 编解码层
↑
记忆调度层 ← 核心:三层记忆协同
↑
记忆治理层(权限/生命周期/水印/隐私)
↑
记忆存储层(MemCube + MemStore)
layered-memory-architecture
| 层级 | 内容 | 载体 | 角色 |
|---|---|---|---|
| 明文记忆 | Prompt/Agent 流 | 自然语言 | 事实、对话上下文 |
| 激活记忆 | KV Cache 管理 | GPU 缓存 | 降低成本、提升命中率 |
| 参数记忆 | 行业 know-how | 后训练权重 | 增强领域认知 |
核心创新
memory-dedup-pipeline
SHA-256 精确去重 → 向量余弦相似度 → LLM Judge 矛盾检测与智能合并 → 平均压缩比 75%+
mem2skill
从对话碎片中提取 → 结构化 → 参数化技能。核心:记忆不止于被搜到,而是内化为能力。 如 K8s OOM 排查从 2 小时 → 10 分钟。
关键数据
- GitHub 8.5K Star,社区 1.2 万+ 活跃用户
- 云服务单月调用 2500 万+ 次,月涨幅 100-200%
- 单次请求节省 45-72% token
- 接入后:LLM Judge 评分↑、上下文成本 -30%、交互轮次 -50%、token 消耗 -50%
clawforce
五层设计 + 三重安全(事前隔离→事中脱敏→事后审计),解决企业 AI Agent 从"能用"到"敢用"的五个痛点。已在研发、电商、公文写作、销售等场景落地。
概念网络
- agent-memory-system — 为何记忆是 Agent 的生死关键
- layered-memory-architecture — 明文/激活/参数分层协同
- model-driven-vs-app-driven-memory — 模型驱动 + 应用驱动
- memory-governance — 全生命周期管理
- agent-memory-lifecycle — 抽取→组织→检索→更新→共享
- memcube — 最小可打包记忆单元
来源:原始存档