Files
myWiki/concepts/data-slice.md

39 lines
1.1 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "Data Slice"
created: 2026-05-15
updated: 2026-05-15
type: concept
tags: [database, sql, data-management]
sources: [raw/papers/zeng-neurida-2025.md]
---
# Data Slice
**Data Slice**(数据切片)是任务特定的关系数据库子集,是 NeurIDA 分析管线的核心数据对象。
## 形式定义
给定分析查询 qData Slice Dq 是从数据库 D 中派生的自包含数据库子集:
```
Dq = {Tₖ,₍q₎ | Tₖ ∈ D, k ∈ Kq ⊆ {1, ..., K}}
```
其中每个 Table Slice Tₖ,₍q₎ 通过关系代数的选择和投影操作得到:
```
Tₖ,₍q₎ = π_Jₖ,₍q₎(σ_Iₖ,₍q₎(Tₖ))
```
- σ:行选择(由查询的 WHERE/JOIN 条件决定)
- π:列投影(由 [[query-intent-analyzer|Data Profiler]] 过滤不相关列决定)
## 在 NeurIDA 中的作用
- Data Slice 由 [[query-intent-analyzer|Query Intent Analyzer]] 自动生成
- 被转换为 [[relational-graph|关系图]]FK-PK 边),作为 DIME 建模的数据结构基础
- 所有后续建模仅在 Data Slice 上进行,无需访问整个数据库
## 来源
- [[zeng-neurida-2025|NeurIDA 论文]]