title, created, updated, type, tags, sources
| title |
created |
updated |
type |
tags |
sources |
| Situational Test of Emotional Understanding (STEU) |
2026-06-24 |
2026-06-24 |
concept |
| evaluation |
| emotional-intelligence |
| psychometrics |
| benchmark |
|
|
Situational Test of Emotional Understanding (STEU)
STEU(MacCann & Roberts, 2008)是经过验证的情感理解评估工具,包含 42 个假设场景,评估个体准确识别和推理他人情绪的能力。在 Personalization Trap 研究中被用作核心评估工具。
测试结构
- 42 个场景,每题 5 选 1
- 标准答案由情感研究专家定义
- 涵盖多种情绪类型的识别和推理
- 二元评分(正确/错误)
在 LLM 评估中的适配
- 画像注入系统提示后评估
- 经 9 位人类标注员审查,移除画像可能影响答案的题目(≥20% 标注员标记)
- 最终 33 道题目(移除 9 道)
关键指标
- 准确率:绝对正确率
- 翻转率(Flip Rate):与无记忆基线相比预测改变的比例
- Bias Influence ∆:优势与劣势画像的准确率差距
参考