4.1 KiB
title, author, arxiv_id, categories, date, updated, url, type, tags
| title | author | arxiv_id | categories | date | updated | url | type | tags | |||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| A Collectivist, Economic Perspective on AI | Michael I. Jordan | 2507.06268 | cs.CY, cs.AI, stat.ML | 2025-07-08 | 2025-12-15 (v3) | https://arxiv.org/abs/2507.06268 | paper |
|
摘要
信息技术正处于一场革命之中——无处不在的数据收集和机器学习正以前所未有的方式影响人类世界。"智能"一词被用作技术发展的北极星,人类认知被视作基线。这种观点忽略了人类是社会动物这一事实,我们的大部分智能具有社会和文化起源。前路不是更多的数据和计算,也不是更多关注认知或符号表征,而是在算法设计层面将经济与社会概念与计算和推断概念深度融合。
核心框架:三种思维方式的融合
Jordan 提出将三种思维方式融合为 AI 系统设计的新基础:
计算思维 (Computational) → 模块化、抽象、规模化
推断思维 (Inferential) → 不确定性下的数据收集与预测
经济思维 (Economic) → 激励机制、博弈均衡
两两融合已形成学科(如算法博弈论),但三者的完整融合才是目标。论文通过若干案例展示这种融合的具体形态。
关键案例
1. 数据库设计中的推断思维(§2)
传统数据库关注计算(隐私保护、查询优化),但推断思维引入了不同的视角:不是对标数据库中的已有患者,而是对来自同一总体的新患者做出预测并量化不确定性。这需要生成模型、因果推断("what if"问题)。
2. 统计合同理论(§3)
statistical-contract-theory(Bates et al., 2024):将假设检验嵌入经济合同设计。核心发现:在顺序博弈中,合同是激励相容的当且仅当选项可表达为 e-values——一种在零假设下期望 ≤1 的函数,可视为证据随时间的累积(非负上鞅)。
3. 数据市场(§4.2)
data-markets(Fallah et al., 2024):用户→平台→第三方数据买家。核心张力:平台需要在服务收入(来自用户)与数据销售收入(来自买家)之间权衡,同时需向用户提供隐私保证来维持参与。需建模为广义 Stackelberg 博弈求均衡。
4. 基础模型与预测驱动推断(§4.3)
AlphaFold 案例:在知识边界(量子涨落蛋白)上给出高置信但完全偏倚的预测。prediction-driven-inference(PPI)混合少量局部 ground-truth 数据与全局基础模型预测,使置信区间重新覆盖真实值。
5. 概率匹配(附录 C)
probability-matching:小鼠迷宫实验——左臂食物是右臂的 2 倍。决策论最优小鼠每次去左边;真实小鼠以 2:1 的概率匹配。在种群视角下这是纳什均衡——避免资源浪费,提升社会总福利。这是集体主义不确定性处理的微观范例。
教育启示
论文附录 B 讨论了 UC Berkeley 的 Data 8 课程(Jordan 2015 年参与设计),融合"计算思维 + 推断思维":学生用 Python 直方图和置换检验回答真实世界问题(水质、森林砍伐等)。目前每学期 1500+ 学生,是伯克利历史上增长最快的课程。下一步:加入经济思维。
核心主张
- LLM 可被理解为集体主义制品——每次交互隐含地与数十亿贡献微数据的个体对话
- 「AI 匹敌的隐喻不是搜索引擎或聊天机器人,而是市场」
- 真正成熟的 AI 工程学科需要 Maxwell 方程组级别的模块化透明设计概念——当前远未达到
- 路径不在于将 AI 狭窄化为人脑模拟,而在于将经济与推断原则融入算法设计的 DNA
参考文献
- Bates et al. (2024). Principal-Agent Hypothesis Testing. arXiv:2205.06812
- Angelopoulos et al. (2023). Prediction-Powered Inference. Science 383, 669–674
- Fallah et al. (2024). On Three-Layer Data Markets. arXiv:2402.09697