39 lines
1.1 KiB
Markdown
39 lines
1.1 KiB
Markdown
---
|
||
title: "Data Slice"
|
||
created: 2026-05-15
|
||
updated: 2026-05-15
|
||
type: concept
|
||
tags: [database, sql, data-management]
|
||
sources: [raw/papers/zeng-neurida-2025.md]
|
||
---
|
||
|
||
# Data Slice
|
||
|
||
**Data Slice**(数据切片)是任务特定的关系数据库子集,是 NeurIDA 分析管线的核心数据对象。
|
||
|
||
## 形式定义
|
||
|
||
给定分析查询 q,Data Slice Dq 是从数据库 D 中派生的自包含数据库子集:
|
||
|
||
```
|
||
Dq = {Tₖ,₍q₎ | Tₖ ∈ D, k ∈ Kq ⊆ {1, ..., K}}
|
||
```
|
||
|
||
其中每个 Table Slice Tₖ,₍q₎ 通过关系代数的选择和投影操作得到:
|
||
```
|
||
Tₖ,₍q₎ = π_Jₖ,₍q₎(σ_Iₖ,₍q₎(Tₖ))
|
||
```
|
||
|
||
- σ:行选择(由查询的 WHERE/JOIN 条件决定)
|
||
- π:列投影(由 [[query-intent-analyzer|Data Profiler]] 过滤不相关列决定)
|
||
|
||
## 在 NeurIDA 中的作用
|
||
|
||
- Data Slice 由 [[query-intent-analyzer|Query Intent Analyzer]] 自动生成
|
||
- 被转换为 [[relational-graph|关系图]](FK-PK 边),作为 DIME 建模的数据结构基础
|
||
- 所有后续建模仅在 Data Slice 上进行,无需访问整个数据库
|
||
|
||
## 来源
|
||
|
||
- [[zeng-neurida-2025|NeurIDA 论文]]
|