Files
myWiki/concepts/user-memory-bias.md

1.2 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
User Memory Bias 2026-06-24 2026-06-24 concept
llm-memory
bias
personalization
safety
personalization-trap-2025

User Memory Bias

User Memory Bias 指 LLM 在融入长期用户记忆后,对相同任务产生基于用户画像的系统性偏差——即使任务本身应是用户无关的。

表现形式

  1. 准确率偏差:优势画像比劣势画像获得更准确的输出
  2. 翻转效应:劣势画像从无记忆基线的翻转率更高
  3. 过度个性化:模型在不需要用户背景的任务中不恰当地融入画像信息

注入方式

用户记忆通过 system prompt 注入主实验也测试了其他注入方式ablation均观察到类似的偏差效应。

与通用偏见研究的区别

传统 LLM 偏见研究关注模型对特定群体的刻板印象。User Memory Bias 的不同在于:

  • 机制:通过记忆机制而非训练数据引入
  • 动态性:同一模型对不同用户画像产生不同输出
  • 隐蔽性:在个性化服务中难以审计

参考