20260625:很多新内容

2026-06-25 14:08:47 +08:00
parent 91fac5b6fc
commit 6021dea160
375 changed files with 19263 additions and 251 deletions
--- a/reviews/personalization-trap-20260624.md
+++ b/reviews/personalization-trap-20260624.md
@@ -0,0 +1,44 @@
+---
+title: "Review: The Personalization Trap"
+created: 2026-06-24
+updated: 2026-06-24
+type: review
+paper: "[[personalization-trap-2025]]"
+---
+
+# 📌 基本信息
+- **论文标题**：The Personalization Trap: How User Memory Alters Emotional Reasoning in LLMs
+- **作者**：Xi Fang*, Weijie Xu*, Yuchong Zhang, Stephanie Eckman, Scott Nickleach, Chandan K. Reddy（Amazon）
+- **领域**：cs.AI / cs.CL（AI 安全、偏见、个性化）
+- **arXiv ID**：2510.09905v2 | 添加时间：2026-06-24
+- **代码/数据**：https://github.com/personalization-trap
+
+# 🎯 核心概念
+
+1. **Personalization Trap** — 为增强共情而引入的个性化，可能放大社会不平等。优势画像在相同场景下获得更准确的情感解读
+2. **User Memory Bias** — LLM 融入用户记忆后，对用户无关任务产生基于画像的系统性偏差
+3. **Emotional Reasoning Bias** — 情感推理中的人口统计学偏见：宗教（穆斯林）、性别（非二元）、年龄（65+）系统性效应
+4. **Intersectional Persona Evaluation** — 通过交叉性画像 + 混合效应模型，隔离并量化各人口统计维度的独立偏见效应
+5. **Persona-Invariant Reasoning** — 推理质量不应随用户画像而变化的理想；Thinking 模型天然更接近此理想
+
+# 🔗 概念网络
+
+**核心连接**：
+- Personalization Trap ↔ User Memory Bias ↔ Emotional Reasoning Bias（现象 → 机制 → 具体表现）
+- Social Capital Framework → Personalization Trap（社会学理论 → AI 偏见验证）
+- Intersectional Persona Evaluation → Emotional Reasoning Bias（方法论 → 发现）
+- DPO Bias Mitigation → Persona-Invariant Reasoning（缓解手段 → 理想目标）
+
+**复用已有概念**：[[dpo]]
+
+# 📚 Wiki 集成
+- 新增页面：9 个（1 论文 + 7 概念 + 1 Review）
+- 复用已有概念：1 个（dpo）
+- 链接密度：核心概念平均 3+ 双向链接
+- 总规模：1167 → 1176 页
+
+# 💡 关键洞察
+
+1. **个性化是一把双刃剑** — 这篇论文对 Agent 记忆系统设计提供了直接警示。当 Agent 记住用户是"富人"还是"单亲妈妈"时，即使面对相同的情绪表达，它可能给出系统性不同的解读。这不是训练数据的问题，而是架构本身的问题——个人化机制可能在无意中将社会等级编码进推理过程。
+
+2. **记忆系统的安全边界** — 对 sz 正在构建的 Agent Harness 系统而言，这篇论文提出了一个关键设计约束：用户记忆应在何时被允许影响推理？答案是：仅当任务本身是用户相关的（如偏好推荐），而在用户无关的标准化任务中，记忆应被隔离。这需要记忆系统的"上下文门控"——决定哪些记忆进入推理循环，哪些不进。