64 lines
2.9 KiB
Markdown
64 lines
2.9 KiB
Markdown
---
|
||
title: "MemOS:Agent 记忆系统从效率工具到生存关键"
|
||
created: 2026-06-19
|
||
updated: 2026-06-19
|
||
type: article-raw
|
||
source: https://mp.weixin.qq.com/s/5Wo91nzstNtCIV9chnuQmw
|
||
speaker: 熊飞宇
|
||
company: 记忆张量(MemTensor)
|
||
publisher: DataFun
|
||
---
|
||
|
||
# MemOS:Agent 记忆系统从效率工具到生存关键
|
||
|
||
**分享嘉宾**:熊飞宇,记忆张量(上海)科技有限公司创始人兼CEO,上海算法创新研究院大模型中心负责人
|
||
**出品社区**:DataFun
|
||
|
||
## 核心观点
|
||
|
||
记忆(Memory)正在成为 AI Agent 最大的短板。ChatGPT 上线个人记忆功能 + OpenClaw 连续型 Agent 出现后,行业形成共识:记忆不再是锦上添花,而是 Agent 能否持续进化的核心要素。
|
||
|
||
## 内容概要
|
||
|
||
### 1. 记忆演进:从效率工具到生死关键
|
||
- ChatGPT 记忆功能:个性化理解是 AGI 时代的关键
|
||
- OpenClaw 出现:缺乏良好记忆系统,长程 Agent 任务无法顺利执行
|
||
- 从 single-session → multi-session/multi-user/multi-agent/multi-apps,复杂度指数增长
|
||
|
||
### 2. 两条技术路径
|
||
- **模型驱动**:Memorizing Transformers 等架构创新,成本极高,失败风险大
|
||
- **应用驱动**:Prompt/Agent 流模拟记忆(Mem0, Zep),轻量但结合不紧密
|
||
- **MemTensor 做法**:融合两条路径——模型驱动决定上限,应用驱动决定下限
|
||
|
||
### 3. MemOS 五层架构
|
||
- 记忆存储层:MemCube(最小记忆单元)+ MemStore(可交易记忆市场)
|
||
- 记忆治理层:权限管理、生命周期、水印、隐私
|
||
- 记忆调度层:核心——明文记忆、激活记忆、参数记忆三层协同
|
||
- 编解码层 + 应用层
|
||
|
||
### 4. 三层记忆协同
|
||
- **明文记忆**(Explicit):Prompt/Agent 流处理,业界主流
|
||
- **激活记忆**(Activation):KV Cache 管理,优化缓存命中率和 token 消耗
|
||
- **参数记忆**(Parameter):行业 know-how 通过后训练注入大模型
|
||
|
||
### 5. 平台规模
|
||
- GitHub 8.5K Star,社区 1.2 万+ 活跃用户
|
||
- 云服务单月调用量 2500 万+,月涨幅 100-200%
|
||
- 单次请求节省 45-72% token
|
||
|
||
### 6. MemOS 增强 OpenClaw(六大维度)
|
||
- 存储类型、检索(多路召回/时间衰减/去重)、进化(Mem2Skill)、可视化、协作(Hub)
|
||
- 三级去重漏斗:SHA-256 → 向量余弦相似度 → LLM Judge
|
||
- 平均压缩比 75%+,token 消耗降低近 50%
|
||
- 核心创新 Mem2Skill:记忆不止于被搜到,而是内化为能力
|
||
|
||
### 7. ClawForce 企业产品
|
||
- 解决五痛点:部署难、经验散、响应遗漏、场景受限、数据不可追溯
|
||
- 五层设计:智能中枢 + 记忆层 + Skill 引擎 + 事件监听 + 工具链接
|
||
- 三重安全:事前隔离 → 事中脱敏加密 → 事后审计
|
||
- 场景:研发全链路自动化、电商 7×24 监控、公文写作(-85% 耗时)、销售(客户触达翻倍)
|
||
|
||
### 8. 一体机方案
|
||
- NVIDIA DGX 一体机(128G 显存 + 内存共享)
|
||
- 中国电信国产算力方案
|