SidneyZhang/myWiki

Files

Sidney Zhang 6021dea160

20260625:很多新内容

2026-06-25 14:08:47 +08:00

1.2 KiB

Raw Blame History

title, created, updated, type, tags, sources

title

created

updated

type

tags

sources

User Memory Bias

2026-06-24

2026-06-24

concept

llm-memory

bias

personalization

safety

personalization-trap-2025

User Memory Bias

User Memory Bias 指 LLM 在融入长期用户记忆后，对相同任务产生基于用户画像的系统性偏差——即使任务本身应是用户无关的。

表现形式

准确率偏差：优势画像比劣势画像获得更准确的输出
翻转效应：劣势画像从无记忆基线的翻转率更高
过度个性化：模型在不需要用户背景的任务中不恰当地融入画像信息

注入方式

用户记忆通过 system prompt 注入（主实验），也测试了其他注入方式（ablation），均观察到类似的偏差效应。

与通用偏见研究的区别

传统 LLM 偏见研究关注模型对特定群体的刻板印象。User Memory Bias 的不同在于：

机制：通过记忆机制而非训练数据引入
动态性：同一模型对不同用户画像产生不同输出
隐蔽性：在个性化服务中难以审计

参考