Files
myWiki/reviews/neurida-review-20260515.md

71 lines
3.4 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "NeurIDA 论文集成 Review"
created: 2026-05-15
type: review
tags: [review, wiki-integration, database, machine-learning]
---
# 📌 基本信息
| 字段 | 内容 |
|------|------|
| 论文 | NeurIDA: Dynamic Modeling for Effective In-Database Analytics |
| 作者 | Lingze Zeng, Naili Xing, Shaofeng Cai, Peng Lu, Gang Chen, Jian Pei, Beng Chin Ooi |
| 机构 | NUS, Zhejiang University, Duke University |
| arXiv | 2512.08483v3 |
| 类别 | cs.DB |
| 集成日期 | 2026-05-15 |
# 🎯 核心概念
1. **[[dynamic-in-database-modeling|Dynamic In-Database Modeling]]** — 从「为每个任务训练固定模型」转向「查询时从共享组件装配定制模型」的新范式,解决 ML 静态性与 RDBMS 动态性的根本矛盾
2. **[[dime-dynamic-in-database-modeling-engine|DIME]]** — 四阶段管线引擎Base Table Embedding → Dynamic Relation Modeling → Dynamic Model Fusion → Task-Aware Prediction
3. **[[composable-base-model-architecture|Composable Base Model Architecture]]** — 异构基础模型池(传统 ML + TRM + Tabular Foundation + LTM+ 三个共享模型组件
4. **[[conditional-model-dispatcher|Conditional Model Dispatcher]]** — ZCP + 历史 EMA 的轻量级模型选择与条件增强调度
5. **[[query-intent-analyzer|Query Intent Analyzer]]** — LLM 驱动的 NLQ→结构化画像解析器零人工特征工程
# 🔗 概念网络
## 核心连接
```
NeurIDA
└─ DIME (核心引擎)
├── Base Table Embedding → 统一元组编码器
├── Dynamic Relation Modeling → 关系图消息传递
└── Dynamic Model Fusion → 上下文感知选择性融合
├─ Query Intent Analyzer → Task Profile + Data Profile
├─ Conditional Model Dispatcher → ZCP + EMA
└─ Analytical Report Synthesizer → LLM 报告生成
```
## 扩展网络
- 连接了 **15 个新概念** + **3 篇相关工作**(占位页面)
- 与更广泛的 [[in-database-analytics|In-Database Analytics]] 领域对接
- 引入 [[tabular-foundation-models|Tabular Foundation Models]] 概念
- 引入 [[zero-cost-proxies|Zero-Cost Proxies]]NAS 领域交叉)
## 断链修复
- 为 3 篇相关论文创建占位页面Trails (VLDB 2024)、Dynamic Model Slicing (VLDB 2024)、NeurDB (CIDR 2025)
# 📚 Wiki 集成
| 指标 | 数值 |
|------|------|
| 新增页面 | 19 个1 论文 + 15 概念 + 3 文献占位) |
| 总页面数 | 300 → 319 |
| 链接完整性 | 100%0 断链) |
| 概念平均链接数 | ~5 个出链/页 |
# 💡 关键洞察
1. **范式转变的启发性**NeurIDA 的核心思想——「从训练模型转向装配模型」——不限于数据库领域。它暗示了一个更一般的趋势:从**固定模型**到**条件化模型工厂**。这对 AI agent 设计也有启示agent 的能力是否也应该从「预定义工具集」转向「查询时动态装配能力模块」?
2. **LLM 的三重角色**:在 NeurIDA 中LLM 扮演了三种不同角色——(a) 接口NLQ 解析)、(b) 推理Data Profiler 的 CoT 决策)、(c) 输出(报告生成)。这种「一个模型,多种接口」的设计模式对 agent 系统设计有参考价值。
3. **数据库 + AI 的融合加速**:论文来自 NUS/ZJU 研究组NeurDB 也是同一团队),表明数据库领域的 AI 化正在从「ML 作为插件」升级到「AI 作为一等公民」的阶段。