myWiki/reviews/neurida-review-20260515.md

---
title: "NeurIDA 论文集成 Review"
created: 2026-05-15
type: review
tags: [review, wiki-integration, database, machine-learning]
---

# 📌 基本信息

| 字段 | 内容 |
|------|------|
| 论文 | NeurIDA: Dynamic Modeling for Effective In-Database Analytics |
| 作者 | Lingze Zeng, Naili Xing, Shaofeng Cai, Peng Lu, Gang Chen, Jian Pei, Beng Chin Ooi |
| 机构 | NUS, Zhejiang University, Duke University |
| arXiv | 2512.08483v3 |
| 类别 | cs.DB |
| 集成日期 | 2026-05-15 |

# 🎯 核心概念

1. **[[dynamic-in-database-modeling|Dynamic In-Database Modeling]]** — 从「为每个任务训练固定模型」转向「查询时从共享组件装配定制模型」的新范式，解决 ML 静态性与 RDBMS 动态性的根本矛盾

2. **[[dime-dynamic-in-database-modeling-engine|DIME]]** — 四阶段管线引擎：Base Table Embedding → Dynamic Relation Modeling → Dynamic Model Fusion → Task-Aware Prediction

3. **[[composable-base-model-architecture|Composable Base Model Architecture]]** — 异构基础模型池（传统 ML + TRM + Tabular Foundation + LTM）+ 三个共享模型组件

4. **[[conditional-model-dispatcher|Conditional Model Dispatcher]]** — ZCP + 历史 EMA 的轻量级模型选择与条件增强调度

5. **[[query-intent-analyzer|Query Intent Analyzer]]** — LLM 驱动的 NLQ→结构化画像解析器，零人工特征工程

# 🔗 概念网络

## 核心连接

```
NeurIDA
  └─ DIME (核心引擎)
       ├── Base Table Embedding → 统一元组编码器
       ├── Dynamic Relation Modeling → 关系图消息传递
       └── Dynamic Model Fusion → 上下文感知选择性融合
  ├─ Query Intent Analyzer → Task Profile + Data Profile
  ├─ Conditional Model Dispatcher → ZCP + EMA
  └─ Analytical Report Synthesizer → LLM 报告生成
```

## 扩展网络
- 连接了 **15 个新概念** + **3 篇相关工作**（占位页面）
- 与更广泛的 [[in-database-analytics|In-Database Analytics]] 领域对接
- 引入 [[tabular-foundation-models|Tabular Foundation Models]] 概念
- 引入 [[zero-cost-proxies|Zero-Cost Proxies]]（NAS 领域交叉）

## 断链修复
- 为 3 篇相关论文创建占位页面：Trails (VLDB 2024)、Dynamic Model Slicing (VLDB 2024)、NeurDB (CIDR 2025)

# 📚 Wiki 集成

| 指标 | 数值 |
|------|------|
| 新增页面 | 19 个（1 论文 + 15 概念 + 3 文献占位） |
| 总页面数 | 300 → 319 |
| 链接完整性 | 100%（0 断链） |
| 概念平均链接数 | ~5 个出链/页 |

# 💡 关键洞察

1. **范式转变的启发性**：NeurIDA 的核心思想——「从训练模型转向装配模型」——不限于数据库领域。它暗示了一个更一般的趋势：从**固定模型**到**条件化模型工厂**。这对 AI agent 设计也有启示：agent 的能力是否也应该从「预定义工具集」转向「查询时动态装配能力模块」？

2. **LLM 的三重角色**：在 NeurIDA 中，LLM 扮演了三种不同角色——(a) 接口（NLQ 解析）、(b) 推理（Data Profiler 的 CoT 决策）、(c) 输出（报告生成）。这种「一个模型，多种接口」的设计模式对 agent 系统设计有参考价值。

3. **数据库 + AI 的融合加速**：论文来自 NUS/ZJU 研究组（NeurDB 也是同一团队），表明数据库领域的 AI 化正在从「ML 作为插件」升级到「AI 作为一等公民」的阶段。