Files
myWiki/concepts/in-database-analytics.md

37 lines
1.2 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: "In-Database Analytics"
created: 2026-05-15
updated: 2026-05-15
type: concept
tags: [database, machine-learning, analytics]
sources: [raw/papers/zeng-neurida-2025.md]
---
# In-Database Analytics
**In-Database Analytics** 指在数据库管理系统内部直接执行 ML/分析任务,无需将数据导出到外部计算环境。
## 核心价值
1. **零数据移动**:消除 ETL/数据导出开销,保持数据本地性
2. **实时性**:分析紧耦合于数据,响应延迟最低
3. **一致性**:分析所用的数据与事务数据一致
4. **治理**:数据库的访问控制、审计等安全机制自然覆盖分析任务
## 代表性系统
- **NeurIDA** — 端到端自主系统,动态建模 + 自然语言接口
- **NeurDB** — AI 驱动的自主数据库CIDR 2025
- **PostgresML** / **MindsDB** — SQL 内嵌 ML 推理
- **Cerebro** — 数据库内的 DL 模型选择
## 关键挑战
- **范式鸿沟**:传统 ML 的静态模型 vs 数据库的动态环境
- **schema 异构**:关系数据的多表结构需要特殊建模
- **查询多样性**:需支持分类、回归等多种预测类型
## 来源
- [[zeng-neurida-2025|NeurIDA 论文]]