Files
myWiki/concepts/data-slice.md

1.1 KiB
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Data Slice 2026-05-15 2026-05-15 concept
database
sql
data-management
raw/papers/zeng-neurida-2025.md

Data Slice

Data Slice(数据切片)是任务特定的关系数据库子集,是 NeurIDA 分析管线的核心数据对象。

形式定义

给定分析查询 qData Slice Dq 是从数据库 D 中派生的自包含数据库子集:

Dq = {Tₖ,₍q₎ | Tₖ ∈ D, k ∈ Kq ⊆ {1, ..., K}}

其中每个 Table Slice Tₖ,₍q₎ 通过关系代数的选择和投影操作得到:

Tₖ,₍q₎ = π_Jₖ,₍q₎(σ_Iₖ,₍q₎(Tₖ))
  • σ:行选择(由查询的 WHERE/JOIN 条件决定)
  • π:列投影(由 query-intent-analyzer 过滤不相关列决定)

在 NeurIDA 中的作用

  • Data Slice 由 query-intent-analyzer 自动生成
  • 被转换为 relational-graphFK-PK 边),作为 DIME 建模的数据结构基础
  • 所有后续建模仅在 Data Slice 上进行,无需访问整个数据库

来源