Files
myWiki/concepts/dime-dynamic-in-database-modeling-engine.md

39 lines
1.6 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "DIME (Dynamic In-Database Modeling Engine)"
created: 2026-05-15
updated: 2026-05-15
type: concept
tags: [database, machine-learning, engine, in-database-analytics]
sources: [raw/papers/zeng-neurida-2025.md]
---
# DIME: Dynamic In-Database Modeling Engine
**DIME** 是 NeurIDA 的核心执行引擎,负责在接收分析任务后动态构造定制模型并进行预测。
## 四阶段管线
### 1. [[base-table-embedding|Base Table Embedding]]
将 [[data-slice|Data Slice]] 中的所有元组转换为向量表示。采用**双路径编码**
- **基础模型路径**:使用 Dispatcher 选出的基础模型生成原生表示,保留其归纳偏置
- **统一编码器路径**:共享的统一元组编码器将异构 schema 的元组映射到统一表示空间
### 2. [[dynamic-relation-modeling|Dynamic Relation Modeling]]
在 [[relational-graph|关系图]]FK-PK 边)上执行关系感知消息传递,将跨表结构信息注入元组嵌入,产生关系嵌入。
### 3. [[dynamic-model-fusion|Dynamic Model Fusion]]
使用上下文感知融合模块,计算关联表中各上下文信号的**重标定重要性分数**,自适应地将最相关的关联上下文融合到目标表元组表示中。
### 4. Task-Aware Prediction
基于融合嵌入,使用任务特定的预测头(分类/回归)生成最终预测。
## 关键特性
- **查询条件化**:整个管线由任务画像和数据画像驱动
- **关系感知**:显式建模 FK-PK 结构,不像传统方法将元组视为独立样本
- **可解释性**:融合模块的重要性分数提供预测归因
## 来源
- [[zeng-neurida-2025|NeurIDA 论文]]