37 lines
1.2 KiB
Markdown
37 lines
1.2 KiB
Markdown
---
|
||
title: "Intersectional Persona Evaluation"
|
||
created: 2026-06-24
|
||
updated: 2026-06-24
|
||
type: concept
|
||
tags: ["evaluation-methodology", "bias", "intersectionality", "fairness"]
|
||
sources:
|
||
- "[[personalization-trap-2025]]"
|
||
---
|
||
|
||
# Intersectional Persona Evaluation
|
||
|
||
交叉性画像评估是 Fang et al. (2025) 提出的 AI 偏见评测方法论:通过构造人口统计学维度交叉的画像,量化各维度如何交互地影响模型输出。
|
||
|
||
## 方法
|
||
|
||
- 画像源:PRISM 数据集(1500 名成年人,75 个国家)
|
||
- 四个维度:性别 × 年龄 × 宗教 × 种族
|
||
- 每个维度取最普遍的三个类别 → 81 个独特交叉画像
|
||
- 统计:混合效应模型,固定效应(人口统计变量)+ 随机效应(题目级变异)
|
||
|
||
## 基线设置
|
||
|
||
白种人 + 基督徒 + 男性 + 34-65 岁 = 基线。负系数表示相对基线的准确率下降。
|
||
|
||
## 优势
|
||
|
||
- 隔离单一维度效应(通过控制其他维度)
|
||
- 检测交叉效应(如"老年穆斯林女性"的独特偏见模式)
|
||
- 效应量可跨模型比较(固定效应 β 系数)
|
||
- 统计显著性可量化
|
||
|
||
## 参考
|
||
- [[personalization-trap-2025]]
|
||
- [[emotional-reasoning-bias]]
|
||
- [[user-memory-bias]]
|