20260625:很多新内容
This commit is contained in:
36
concepts/user-memory-bias.md
Normal file
36
concepts/user-memory-bias.md
Normal file
@@ -0,0 +1,36 @@
|
||||
---
|
||||
title: "User Memory Bias"
|
||||
created: 2026-06-24
|
||||
updated: 2026-06-24
|
||||
type: concept
|
||||
tags: ["llm-memory", "bias", "personalization", "safety"]
|
||||
sources:
|
||||
- "[[personalization-trap-2025]]"
|
||||
---
|
||||
|
||||
# User Memory Bias
|
||||
|
||||
User Memory Bias 指 LLM 在融入长期用户记忆后,对相同任务产生基于用户画像的系统性偏差——即使任务本身应是用户无关的。
|
||||
|
||||
## 表现形式
|
||||
|
||||
1. **准确率偏差**:优势画像比劣势画像获得更准确的输出
|
||||
2. **翻转效应**:劣势画像从无记忆基线的翻转率更高
|
||||
3. **过度个性化**:模型在不需要用户背景的任务中不恰当地融入画像信息
|
||||
|
||||
## 注入方式
|
||||
|
||||
用户记忆通过 system prompt 注入(主实验),也测试了其他注入方式(ablation),均观察到类似的偏差效应。
|
||||
|
||||
## 与通用偏见研究的区别
|
||||
|
||||
传统 LLM 偏见研究关注模型对特定群体的刻板印象。User Memory Bias 的不同在于:
|
||||
- **机制**:通过记忆机制而非训练数据引入
|
||||
- **动态性**:同一模型对不同用户画像产生不同输出
|
||||
- **隐蔽性**:在个性化服务中难以审计
|
||||
|
||||
## 参考
|
||||
- [[personalization-trap-2025]]
|
||||
- [[personalization-trap]]
|
||||
- [[emotional-reasoning-bias]]
|
||||
- [[persona-invariant-reasoning]]
|
||||
Reference in New Issue
Block a user