1.1 KiB
1.1 KiB
title, created, updated, type, tags, sources
| title | created | updated | type | tags | sources | ||||
|---|---|---|---|---|---|---|---|---|---|
| Data Slice | 2026-05-15 | 2026-05-15 | concept |
|
|
Data Slice
Data Slice(数据切片)是任务特定的关系数据库子集,是 NeurIDA 分析管线的核心数据对象。
形式定义
给定分析查询 q,Data Slice Dq 是从数据库 D 中派生的自包含数据库子集:
Dq = {Tₖ,₍q₎ | Tₖ ∈ D, k ∈ Kq ⊆ {1, ..., K}}
其中每个 Table Slice Tₖ,₍q₎ 通过关系代数的选择和投影操作得到:
Tₖ,₍q₎ = π_Jₖ,₍q₎(σ_Iₖ,₍q₎(Tₖ))
- σ:行选择(由查询的 WHERE/JOIN 条件决定)
- π:列投影(由 query-intent-analyzer 过滤不相关列决定)
在 NeurIDA 中的作用
- Data Slice 由 query-intent-analyzer 自动生成
- 被转换为 relational-graph(FK-PK 边),作为 DIME 建模的数据结构基础
- 所有后续建模仅在 Data Slice 上进行,无需访问整个数据库