72 lines
4.1 KiB
Markdown
72 lines
4.1 KiB
Markdown
---
|
||
title: "A Collectivist, Economic Perspective on AI"
|
||
author: Michael I. Jordan
|
||
arxiv_id: "2507.06268"
|
||
categories: cs.CY, cs.AI, stat.ML
|
||
date: 2025-07-08
|
||
updated: 2025-12-15 (v3)
|
||
url: https://arxiv.org/abs/2507.06268
|
||
type: paper
|
||
tags:
|
||
- ai-economics
|
||
- collective-intelligence
|
||
- uncertainty
|
||
- mechanism-design
|
||
- foundation-models
|
||
---
|
||
|
||
## 摘要
|
||
|
||
信息技术正处于一场革命之中——无处不在的数据收集和机器学习正以前所未有的方式影响人类世界。"智能"一词被用作技术发展的北极星,人类认知被视作基线。这种观点忽略了人类是社会动物这一事实,我们的大部分智能具有社会和文化起源。前路不是更多的数据和计算,也不是更多关注认知或符号表征,而是**在算法设计层面将经济与社会概念与计算和推断概念深度融合**。
|
||
|
||
## 核心框架:三种思维方式的融合
|
||
|
||
Jordan 提出将三种思维方式融合为 AI 系统设计的新基础:
|
||
|
||
```
|
||
计算思维 (Computational) → 模块化、抽象、规模化
|
||
推断思维 (Inferential) → 不确定性下的数据收集与预测
|
||
经济思维 (Economic) → 激励机制、博弈均衡
|
||
```
|
||
|
||
两两融合已形成学科(如算法博弈论),但三者的完整融合才是目标。论文通过若干案例展示这种融合的具体形态。
|
||
|
||
## 关键案例
|
||
|
||
### 1. 数据库设计中的推断思维(§2)
|
||
|
||
传统数据库关注计算(隐私保护、查询优化),但**推断思维**引入了不同的视角:不是对标数据库中的已有患者,而是**对来自同一总体的新患者做出预测并量化不确定性**。这需要生成模型、因果推断("what if"问题)。
|
||
|
||
### 2. 统计合同理论(§3)
|
||
|
||
[[statistical-contract-theory|统计合同理论]](Bates et al., 2024):将假设检验嵌入经济合同设计。核心发现:在顺序博弈中,合同是激励相容的当且仅当选项可表达为 **[[e-values|E-values]]**——一种在零假设下期望 ≤1 的函数,可视为证据随时间的累积(非负上鞅)。
|
||
|
||
### 3. 数据市场(§4.2)
|
||
|
||
[[data-markets|三层数据市场]](Fallah et al., 2024):用户→平台→第三方数据买家。核心张力:平台需要在服务收入(来自用户)与数据销售收入(来自买家)之间权衡,同时需向用户提供隐私保证来维持参与。需建模为广义 Stackelberg 博弈求均衡。
|
||
|
||
### 4. 基础模型与预测驱动推断(§4.3)
|
||
|
||
AlphaFold 案例:在知识边界(量子涨落蛋白)上给出高置信但完全偏倚的预测。[[prediction-driven-inference|预测驱动推断]](PPI)混合少量局部 ground-truth 数据与全局基础模型预测,使置信区间重新覆盖真实值。
|
||
|
||
### 5. 概率匹配(附录 C)
|
||
|
||
[[probability-matching|概率匹配]]:小鼠迷宫实验——左臂食物是右臂的 2 倍。决策论最优小鼠每次去左边;真实小鼠以 2:1 的概率匹配。在**种群视角**下这是纳什均衡——避免资源浪费,提升社会总福利。这是集体主义不确定性处理的微观范例。
|
||
|
||
## 教育启示
|
||
|
||
论文附录 B 讨论了 UC Berkeley 的 **Data 8** 课程(Jordan 2015 年参与设计),融合"计算思维 + 推断思维":学生用 Python 直方图和置换检验回答真实世界问题(水质、森林砍伐等)。目前每学期 1500+ 学生,是伯克利历史上增长最快的课程。下一步:加入经济思维。
|
||
|
||
## 核心主张
|
||
|
||
- LLM 可被理解为**集体主义制品**——每次交互隐含地与数十亿贡献微数据的个体对话
|
||
- 「AI 匹敌的隐喻不是搜索引擎或聊天机器人,而是**市场**」
|
||
- 真正成熟的 AI 工程学科需要 Maxwell 方程组级别的**模块化透明设计概念**——当前远未达到
|
||
- 路径不在于将 AI 狭窄化为人脑模拟,而在于将**经济与推断原则融入算法设计的 DNA**
|
||
|
||
## 参考文献
|
||
|
||
- Bates et al. (2024). Principal-Agent Hypothesis Testing. arXiv:2205.06812
|
||
- Angelopoulos et al. (2023). Prediction-Powered Inference. Science 383, 669–674
|
||
- Fallah et al. (2024). On Three-Layer Data Markets. arXiv:2402.09697
|