Files
myWiki/concepts/social-world-model.md

50 lines
2.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Social World Model"
created: 2026-06-20
updated: 2026-06-20
type: concept
tags: ["world-model", "social", "generation", "interactive", "paradigm"]
sources: ["https://arxiv.org/abs/2606.17800"]
---
# Social World Model (社交世界模型)
**Social World Model** 是 [[maineCoon|MaineCoon]] 提出的生成范式:一种**理解、模拟、回应人类社交动态**的生成模型。它将 Gen AI 从被动的「内容生产工具」转变为人类社交网络中**主动互动的参与者**。
## 与传统世界模型的区别
| 维度 | 传统世界模型 | 社交世界模型 |
|------|------------|------------|
| 预测对象 | 物理环境转变、物体轨迹 | 人类社交互动的「社交物理」 |
| 关键信号 | 视觉运动、物体状态 | 眼神、微表情、手势、语音节奏、情感共鸣 |
| 时间尺度 | 分钟级环境仿真 | **实时流式**、亚秒级交互 |
| 模态 | 以视觉为主 | **音视频联合** + 同步 |
| 代表 | [[world-models-rl|RL World Models]], [[world-model-lecun|JEPA]] | MaineCoon (首个) |
## 社交物理 (Social Physics)
人类社交互动有一套高度结构化的多模态行为规则:
1. **同步性**:语音 ↔ 唇动 ↔ 表情的时间对齐
2. **情感共鸣**:通过语调、表情、节奏传递情绪
3. **对话节奏**:快速对话中的轮流和应答
4. **高参与度节奏**:社交视频吸引注意力的内容密度
## 实现阶梯
完整社交世界模型的实现需要多层能力:
1. **生成核心** (MaineCoon 已实现):实时音视频流式生成
2. **主动多模态观察**:观察用户输入(文字/语音/摄像头)
3. **内部用户状态模拟**:建模用户意图、情感
4. **记忆与规划**:跨 session 的长期交互
5. **反应预测**:预测用户对生成内容的反应
## 意义
社交世界模型是下一代 AI-native 社交平台的技术基础。没有它AI 只能被动生成内容有了它AI 可以**主动参与**人类社交。
## 参考
- [[maineCoon|MaineCoon 论文]] — 首个社交世界模型实现
- [[social-video|社交视频]] — 社交世界模型的内容域定义
- [[world-models-rl]]
- [[world-model-lecun]]