57 lines
2.0 KiB
Markdown
57 lines
2.0 KiB
Markdown
---
|
||
title: "三层记忆架构"
|
||
created: 2026-06-19
|
||
updated: 2026-06-19
|
||
type: concept
|
||
tags: [agent-memory, memos, architecture, explicit-memory, parameter-memory, kv-cache]
|
||
sources:
|
||
- https://mp.weixin.qq.com/s/5Wo91nzstNtCIV9chnuQmw
|
||
---
|
||
|
||
# 三层记忆架构(Layered Memory Architecture)
|
||
|
||
## 定义
|
||
|
||
MemOS 提出的三层记忆协同架构:将记忆按粒度分为明文记忆、激活记忆、参数记忆三个层次,实现系统级协同,支撑 AI 从一次性推理走向长期演化。
|
||
|
||
## 三层详解
|
||
|
||
```
|
||
参数记忆(Parameter) ← 行业 know-how 经后训练注入大模型
|
||
↑
|
||
激活记忆(Activation) ← KV Cache 管理,GPU 缓存层
|
||
↑
|
||
明文记忆(Explicit) ← Prompt/Agent 流,自然语言层
|
||
```
|
||
|
||
### 1. 明文记忆(Explicit Memory)
|
||
- 载体:自然语言,Prompt 流或 Agent 流
|
||
- 内容:对话历史、事实信息、用户偏好
|
||
- 特点:业界主流方案(Mem0, Zep 等),实现简单但结构化程度有限
|
||
|
||
### 2. 激活记忆(Activation Memory)
|
||
- 载体:KV Cache,GPU 显存
|
||
- 内容:推理时的缓存状态
|
||
- 作用:提升缓存命中率,降低 token 消耗和延迟
|
||
- 场景:情感陪伴、游戏 NPC、消费硬件等对延迟敏感的场景
|
||
|
||
### 3. 参数记忆(Parameter Memory)
|
||
- 载体:模型权重(通过后训练注入)
|
||
- 内容:行业 know-how、领域专业知识
|
||
- 特点:最深层——行业认知能力通过训练内化为模型能力
|
||
|
||
## 为什么要三层?
|
||
|
||
业界多数框架只工作在明文记忆层(Prompt/Agent 流),但:
|
||
- 参数层增强领域认知能力(从"知道"到"理解")
|
||
- 激活层优化运行效率和用户体验(降低 token 消耗)
|
||
- 明文层提供灵活的事实和上下文支撑
|
||
|
||
MemOS 是业界唯一一个从底层 Infra、记忆基模到上层应用进行全面增强的记忆系统。
|
||
|
||
## 参考
|
||
|
||
- [[agent-memory-system|Agent 记忆系统]]
|
||
- [[memtensor-memos-agent-memory-2026|MemOS 技术分享]]
|
||
- [[agent-memory-lifecycle|记忆生命周期]]
|