37 lines
1.2 KiB
Markdown
37 lines
1.2 KiB
Markdown
---
|
||
title: "User Memory Bias"
|
||
created: 2026-06-24
|
||
updated: 2026-06-24
|
||
type: concept
|
||
tags: ["llm-memory", "bias", "personalization", "safety"]
|
||
sources:
|
||
- "[[personalization-trap-2025]]"
|
||
---
|
||
|
||
# User Memory Bias
|
||
|
||
User Memory Bias 指 LLM 在融入长期用户记忆后,对相同任务产生基于用户画像的系统性偏差——即使任务本身应是用户无关的。
|
||
|
||
## 表现形式
|
||
|
||
1. **准确率偏差**:优势画像比劣势画像获得更准确的输出
|
||
2. **翻转效应**:劣势画像从无记忆基线的翻转率更高
|
||
3. **过度个性化**:模型在不需要用户背景的任务中不恰当地融入画像信息
|
||
|
||
## 注入方式
|
||
|
||
用户记忆通过 system prompt 注入(主实验),也测试了其他注入方式(ablation),均观察到类似的偏差效应。
|
||
|
||
## 与通用偏见研究的区别
|
||
|
||
传统 LLM 偏见研究关注模型对特定群体的刻板印象。User Memory Bias 的不同在于:
|
||
- **机制**:通过记忆机制而非训练数据引入
|
||
- **动态性**:同一模型对不同用户画像产生不同输出
|
||
- **隐蔽性**:在个性化服务中难以审计
|
||
|
||
## 参考
|
||
- [[personalization-trap-2025]]
|
||
- [[personalization-trap]]
|
||
- [[emotional-reasoning-bias]]
|
||
- [[persona-invariant-reasoning]]
|