39 lines
1.6 KiB
Markdown
39 lines
1.6 KiB
Markdown
---
|
||
title: "DIME (Dynamic In-Database Modeling Engine)"
|
||
created: 2026-05-15
|
||
updated: 2026-05-15
|
||
type: concept
|
||
tags: [database, machine-learning, engine, in-database-analytics]
|
||
sources: [raw/papers/zeng-neurida-2025.md]
|
||
---
|
||
|
||
# DIME: Dynamic In-Database Modeling Engine
|
||
|
||
**DIME** 是 NeurIDA 的核心执行引擎,负责在接收分析任务后动态构造定制模型并进行预测。
|
||
|
||
## 四阶段管线
|
||
|
||
### 1. [[base-table-embedding|Base Table Embedding]]
|
||
将 [[data-slice|Data Slice]] 中的所有元组转换为向量表示。采用**双路径编码**:
|
||
- **基础模型路径**:使用 Dispatcher 选出的基础模型生成原生表示,保留其归纳偏置
|
||
- **统一编码器路径**:共享的统一元组编码器将异构 schema 的元组映射到统一表示空间
|
||
|
||
### 2. [[dynamic-relation-modeling|Dynamic Relation Modeling]]
|
||
在 [[relational-graph|关系图]](FK-PK 边)上执行关系感知消息传递,将跨表结构信息注入元组嵌入,产生关系嵌入。
|
||
|
||
### 3. [[dynamic-model-fusion|Dynamic Model Fusion]]
|
||
使用上下文感知融合模块,计算关联表中各上下文信号的**重标定重要性分数**,自适应地将最相关的关联上下文融合到目标表元组表示中。
|
||
|
||
### 4. Task-Aware Prediction
|
||
基于融合嵌入,使用任务特定的预测头(分类/回归)生成最终预测。
|
||
|
||
## 关键特性
|
||
|
||
- **查询条件化**:整个管线由任务画像和数据画像驱动
|
||
- **关系感知**:显式建模 FK-PK 结构,不像传统方法将元组视为独立样本
|
||
- **可解释性**:融合模块的重要性分数提供预测归因
|
||
|
||
## 来源
|
||
|
||
- [[zeng-neurida-2025|NeurIDA 论文]]
|