20260514:增加新内容
This commit is contained in:
52
concepts/path-tracing.md
Normal file
52
concepts/path-tracing.md
Normal file
@@ -0,0 +1,52 @@
|
||||
---
|
||||
title: "路径追踪 (Path Tracing)"
|
||||
domain: "Multimodal AI / Visual Reasoning"
|
||||
tags: [path-tracing, visual-primitives, bezier-curves, topological-reasoning]
|
||||
sources: [[thinking-with-visual-primitives]]
|
||||
---
|
||||
|
||||
# 路径追踪 (Path Tracing)
|
||||
|
||||
> 利用点视觉原语在纠缠曲线中追踪目标路径,识别端点——测试模型「线连续性判断」的原语能力。
|
||||
|
||||
## 任务定义
|
||||
|
||||
给定一张包含多条 Bézier 曲线的图像(每条连接一个标记起点到一个标记终点),模型需要:
|
||||
1. 从指定起点出发
|
||||
2. 沿着曲线追踪(处理与其他曲线的交叉点)
|
||||
3. 识别到达的端点
|
||||
|
||||
## 核心挑战:交叉点消歧
|
||||
|
||||
在曲线交叉处,模型必须调用**局部几何连续性判断**来决定哪条分支是目标曲线的延续。这要求模型具备真正的「路径追踪原语」,而非靠颜色匹配。
|
||||
|
||||
- **统一风格模式**(uniform-style mode):所有线颜色和粗细相同,消除颜色捷径
|
||||
|
||||
## 难度控制
|
||||
|
||||
- 曲线数量 + 曲率振幅
|
||||
- Easy:少量平缓曲线,交叉稀疏
|
||||
- Hard:大量紧密卷曲曲线,密集交叉点
|
||||
|
||||
## 思维内容格式
|
||||
|
||||
```
|
||||
<|point|>[[x1,y1],[x2,y2],...[xn,yn]]<|/point|>
|
||||
```
|
||||
- 坐标密度自适应局部几何:直段稀疏,弯曲/交叉区域密集
|
||||
- 模拟人类在复杂区域的「慢下来仔细观察」策略
|
||||
|
||||
## 奖励模型设计
|
||||
|
||||
[[bidirectional-trajectory-evaluation|双向轨迹评估]] 是核心:
|
||||
- **前向偏差**:预测点到真实曲线的最小距离(惩罚偏离)
|
||||
- **反向覆盖率**:真实曲线点被预测覆盖的程度(惩罚遗漏)
|
||||
- **端点精度** + **连续性惩罚** + **答案正确性**
|
||||
|
||||
**冷启动规模**:**125,000** 样本
|
||||
|
||||
## 相关概念
|
||||
|
||||
- [[maze-navigation|迷宫导航]] — 互补的拓扑推理任务
|
||||
- [[bidirectional-trajectory-evaluation|双向轨迹评估]] — 核心评估方法
|
||||
- [[visual-primitives|视觉原语]] — 点原语
|
||||
Reference in New Issue
Block a user