20260518-morning:新增内容
This commit is contained in:
38
concepts/data-slice.md
Normal file
38
concepts/data-slice.md
Normal file
@@ -0,0 +1,38 @@
|
||||
---
|
||||
title: "Data Slice"
|
||||
created: 2026-05-15
|
||||
updated: 2026-05-15
|
||||
type: concept
|
||||
tags: [database, sql, data-management]
|
||||
sources: [raw/papers/zeng-neurida-2025.md]
|
||||
---
|
||||
|
||||
# Data Slice
|
||||
|
||||
**Data Slice**(数据切片)是任务特定的关系数据库子集,是 NeurIDA 分析管线的核心数据对象。
|
||||
|
||||
## 形式定义
|
||||
|
||||
给定分析查询 q,Data Slice Dq 是从数据库 D 中派生的自包含数据库子集:
|
||||
|
||||
```
|
||||
Dq = {Tₖ,₍q₎ | Tₖ ∈ D, k ∈ Kq ⊆ {1, ..., K}}
|
||||
```
|
||||
|
||||
其中每个 Table Slice Tₖ,₍q₎ 通过关系代数的选择和投影操作得到:
|
||||
```
|
||||
Tₖ,₍q₎ = π_Jₖ,₍q₎(σ_Iₖ,₍q₎(Tₖ))
|
||||
```
|
||||
|
||||
- σ:行选择(由查询的 WHERE/JOIN 条件决定)
|
||||
- π:列投影(由 [[query-intent-analyzer|Data Profiler]] 过滤不相关列决定)
|
||||
|
||||
## 在 NeurIDA 中的作用
|
||||
|
||||
- Data Slice 由 [[query-intent-analyzer|Query Intent Analyzer]] 自动生成
|
||||
- 被转换为 [[relational-graph|关系图]](FK-PK 边),作为 DIME 建模的数据结构基础
|
||||
- 所有后续建模仅在 Data Slice 上进行,无需访问整个数据库
|
||||
|
||||
## 来源
|
||||
|
||||
- [[zeng-neurida-2025|NeurIDA 论文]]
|
||||
Reference in New Issue
Block a user