Files
myWiki/concepts/user-memory-bias.md

37 lines
1.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "User Memory Bias"
created: 2026-06-24
updated: 2026-06-24
type: concept
tags: ["llm-memory", "bias", "personalization", "safety"]
sources:
- "[[personalization-trap-2025]]"
---
# User Memory Bias
User Memory Bias 指 LLM 在融入长期用户记忆后,对相同任务产生基于用户画像的系统性偏差——即使任务本身应是用户无关的。
## 表现形式
1. **准确率偏差**:优势画像比劣势画像获得更准确的输出
2. **翻转效应**:劣势画像从无记忆基线的翻转率更高
3. **过度个性化**:模型在不需要用户背景的任务中不恰当地融入画像信息
## 注入方式
用户记忆通过 system prompt 注入主实验也测试了其他注入方式ablation均观察到类似的偏差效应。
## 与通用偏见研究的区别
传统 LLM 偏见研究关注模型对特定群体的刻板印象。User Memory Bias 的不同在于:
- **机制**:通过记忆机制而非训练数据引入
- **动态性**:同一模型对不同用户画像产生不同输出
- **隐蔽性**:在个性化服务中难以审计
## 参考
- [[personalization-trap-2025]]
- [[personalization-trap]]
- [[emotional-reasoning-bias]]
- [[persona-invariant-reasoning]]