20260518-morning:新增内容

This commit is contained in:
2026-05-18 10:17:56 +08:00
parent b116710e4c
commit 2faf4bb002
38 changed files with 1528 additions and 2 deletions

38
concepts/data-slice.md Normal file
View File

@@ -0,0 +1,38 @@
---
title: "Data Slice"
created: 2026-05-15
updated: 2026-05-15
type: concept
tags: [database, sql, data-management]
sources: [raw/papers/zeng-neurida-2025.md]
---
# Data Slice
**Data Slice**(数据切片)是任务特定的关系数据库子集,是 NeurIDA 分析管线的核心数据对象。
## 形式定义
给定分析查询 qData Slice Dq 是从数据库 D 中派生的自包含数据库子集:
```
Dq = {Tₖ,₍q₎ | Tₖ ∈ D, k ∈ Kq ⊆ {1, ..., K}}
```
其中每个 Table Slice Tₖ,₍q₎ 通过关系代数的选择和投影操作得到:
```
Tₖ,₍q₎ = π_Jₖ,₍q₎(σ_Iₖ,₍q₎(Tₖ))
```
- σ:行选择(由查询的 WHERE/JOIN 条件决定)
- π:列投影(由 [[query-intent-analyzer|Data Profiler]] 过滤不相关列决定)
## 在 NeurIDA 中的作用
- Data Slice 由 [[query-intent-analyzer|Query Intent Analyzer]] 自动生成
- 被转换为 [[relational-graph|关系图]]FK-PK 边),作为 DIME 建模的数据结构基础
- 所有后续建模仅在 Data Slice 上进行,无需访问整个数据库
## 来源
- [[zeng-neurida-2025|NeurIDA 论文]]