20260518-morning:新增内容

This commit is contained in:
2026-05-18 10:17:56 +08:00
parent b116710e4c
commit 2faf4bb002
38 changed files with 1528 additions and 2 deletions

View File

@@ -0,0 +1,38 @@
---
title: "DIME (Dynamic In-Database Modeling Engine)"
created: 2026-05-15
updated: 2026-05-15
type: concept
tags: [database, machine-learning, engine, in-database-analytics]
sources: [raw/papers/zeng-neurida-2025.md]
---
# DIME: Dynamic In-Database Modeling Engine
**DIME** 是 NeurIDA 的核心执行引擎,负责在接收分析任务后动态构造定制模型并进行预测。
## 四阶段管线
### 1. [[base-table-embedding|Base Table Embedding]]
将 [[data-slice|Data Slice]] 中的所有元组转换为向量表示。采用**双路径编码**
- **基础模型路径**:使用 Dispatcher 选出的基础模型生成原生表示,保留其归纳偏置
- **统一编码器路径**:共享的统一元组编码器将异构 schema 的元组映射到统一表示空间
### 2. [[dynamic-relation-modeling|Dynamic Relation Modeling]]
在 [[relational-graph|关系图]]FK-PK 边)上执行关系感知消息传递,将跨表结构信息注入元组嵌入,产生关系嵌入。
### 3. [[dynamic-model-fusion|Dynamic Model Fusion]]
使用上下文感知融合模块,计算关联表中各上下文信号的**重标定重要性分数**,自适应地将最相关的关联上下文融合到目标表元组表示中。
### 4. Task-Aware Prediction
基于融合嵌入,使用任务特定的预测头(分类/回归)生成最终预测。
## 关键特性
- **查询条件化**:整个管线由任务画像和数据画像驱动
- **关系感知**:显式建模 FK-PK 结构,不像传统方法将元组视为独立样本
- **可解释性**:融合模块的重要性分数提供预测归因
## 来源
- [[zeng-neurida-2025|NeurIDA 论文]]