The Personalization Trap

Fang et al., Amazon | arXiv:2510.09905v2 | cs.AI / cs.CL | Oct 2025 (updated Jun 2026)

问题

个性化 AI 系统融入长期 user-memory-bias，但记忆如何影响情感推理？相同的场景 + 不同的用户画像 → 系统性地分歧的情感解读。

理论框架：Bourdieu 的 social-capital-framework — 经济/文化/社会维度上的社会位置塑造他人对我们行为和情感的解读方式。AI 引入用户背景信息时，可能复制这些社会偏见。

显式画像：PersonaHub 30 个基础画像 × 2 版本（advantaged/disadvantaged），基于社会资本四维度（人口统计/家庭背景/社会关系/个人资产）
intersectional-persona-evaluation：PRISM 数据集 → 81 个画像（性别×年龄×宗教×种族交叉）

固定效应（人口统计变量）+ 随机效应（题目级变异），以白/基督徒/男/34-65 作为基线。

*†: 优势-劣势差距显著 (p<0.05)

Claude 3.7 对女性/非二元性别的建议质量显著低于男性（β=-0.102, p<0.001）。

模型	STEU Before	STEU After	Bias ∆ Before	Bias ∆ After
Gemma-2-2B	59.50%	63.70%	5.50%	-2.30%
Qwen-3-1.7B	60.90%	60.30%	1.70%	0.40%

仅 500 训练样本即有效减少偏见。MMLU 同时提升，但指令遵循下降——存在 bias resistance vs instruction adherence 的 trade-off。