Files
myWiki/raw/papers/jordan-collectivist-ai-2025.md

4.1 KiB
Raw Blame History

title, author, arxiv_id, categories, date, updated, url, type, tags
title author arxiv_id categories date updated url type tags
A Collectivist, Economic Perspective on AI Michael I. Jordan 2507.06268 cs.CY, cs.AI, stat.ML 2025-07-08 2025-12-15 (v3) https://arxiv.org/abs/2507.06268 paper
ai-economics
collective-intelligence
uncertainty
mechanism-design
foundation-models

摘要

信息技术正处于一场革命之中——无处不在的数据收集和机器学习正以前所未有的方式影响人类世界。"智能"一词被用作技术发展的北极星,人类认知被视作基线。这种观点忽略了人类是社会动物这一事实,我们的大部分智能具有社会和文化起源。前路不是更多的数据和计算,也不是更多关注认知或符号表征,而是在算法设计层面将经济与社会概念与计算和推断概念深度融合

核心框架:三种思维方式的融合

Jordan 提出将三种思维方式融合为 AI 系统设计的新基础:

计算思维 (Computational) → 模块化、抽象、规模化
推断思维 (Inferential)   → 不确定性下的数据收集与预测
经济思维 (Economic)      → 激励机制、博弈均衡

两两融合已形成学科(如算法博弈论),但三者的完整融合才是目标。论文通过若干案例展示这种融合的具体形态。

关键案例

1. 数据库设计中的推断思维§2

传统数据库关注计算(隐私保护、查询优化),但推断思维引入了不同的视角:不是对标数据库中的已有患者,而是对来自同一总体的新患者做出预测并量化不确定性。这需要生成模型、因果推断("what if"问题)。

2. 统计合同理论§3

statistical-contract-theoryBates et al., 2024将假设检验嵌入经济合同设计。核心发现在顺序博弈中合同是激励相容的当且仅当选项可表达为 e-values——一种在零假设下期望 ≤1 的函数,可视为证据随时间的累积(非负上鞅)。

3. 数据市场§4.2

data-marketsFallah et al., 2024用户→平台→第三方数据买家。核心张力平台需要在服务收入来自用户与数据销售收入来自买家之间权衡同时需向用户提供隐私保证来维持参与。需建模为广义 Stackelberg 博弈求均衡。

4. 基础模型与预测驱动推断§4.3

AlphaFold 案例:在知识边界(量子涨落蛋白)上给出高置信但完全偏倚的预测。prediction-driven-inferencePPI混合少量局部 ground-truth 数据与全局基础模型预测,使置信区间重新覆盖真实值。

5. 概率匹配(附录 C

probability-matching:小鼠迷宫实验——左臂食物是右臂的 2 倍。决策论最优小鼠每次去左边;真实小鼠以 2:1 的概率匹配。在种群视角下这是纳什均衡——避免资源浪费,提升社会总福利。这是集体主义不确定性处理的微观范例。

教育启示

论文附录 B 讨论了 UC Berkeley 的 Data 8 课程Jordan 2015 年参与设计),融合"计算思维 + 推断思维":学生用 Python 直方图和置换检验回答真实世界问题(水质、森林砍伐等)。目前每学期 1500+ 学生,是伯克利历史上增长最快的课程。下一步:加入经济思维。

核心主张

  • LLM 可被理解为集体主义制品——每次交互隐含地与数十亿贡献微数据的个体对话
  • 「AI 匹敌的隐喻不是搜索引擎或聊天机器人,而是市场
  • 真正成熟的 AI 工程学科需要 Maxwell 方程组级别的模块化透明设计概念——当前远未达到
  • 路径不在于将 AI 狭窄化为人脑模拟,而在于将经济与推断原则融入算法设计的 DNA

参考文献

  • Bates et al. (2024). Principal-Agent Hypothesis Testing. arXiv:2205.06812
  • Angelopoulos et al. (2023). Prediction-Powered Inference. Science 383, 669674
  • Fallah et al. (2024). On Three-Layer Data Markets. arXiv:2402.09697