2.0 KiB
2.0 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | |||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 三层记忆架构 | 2026-06-19 | 2026-06-19 | concept |
|
|
三层记忆架构(Layered Memory Architecture)
定义
MemOS 提出的三层记忆协同架构:将记忆按粒度分为明文记忆、激活记忆、参数记忆三个层次,实现系统级协同,支撑 AI 从一次性推理走向长期演化。
三层详解
参数记忆(Parameter) ← 行业 know-how 经后训练注入大模型
↑
激活记忆(Activation) ← KV Cache 管理,GPU 缓存层
↑
明文记忆(Explicit) ← Prompt/Agent 流,自然语言层
1. 明文记忆(Explicit Memory)
- 载体:自然语言,Prompt 流或 Agent 流
- 内容:对话历史、事实信息、用户偏好
- 特点:业界主流方案(Mem0, Zep 等),实现简单但结构化程度有限
2. 激活记忆(Activation Memory)
- 载体:KV Cache,GPU 显存
- 内容:推理时的缓存状态
- 作用:提升缓存命中率,降低 token 消耗和延迟
- 场景:情感陪伴、游戏 NPC、消费硬件等对延迟敏感的场景
3. 参数记忆(Parameter Memory)
- 载体:模型权重(通过后训练注入)
- 内容:行业 know-how、领域专业知识
- 特点:最深层——行业认知能力通过训练内化为模型能力
为什么要三层?
业界多数框架只工作在明文记忆层(Prompt/Agent 流),但:
- 参数层增强领域认知能力(从"知道"到"理解")
- 激活层优化运行效率和用户体验(降低 token 消耗)
- 明文层提供灵活的事实和上下文支撑
MemOS 是业界唯一一个从底层 Infra、记忆基模到上层应用进行全面增强的记忆系统。