Files
myWiki/concepts/native-sparse-attention.md

651 B
Raw Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Native Sparse Attention (NSA) 2025-04-15 2026-05-01 concept

Native Sparse Attention (NSA)

硬件对齐的原生可训练稀疏注意力DeepSeek 2025 年提出。

核心创新

稀疏模式在训练阶段即被学习("原生"而非仅在推理时施加同时稀疏模式设计与硬件GPU Tensor Core天然对齐。

相关概念