Files
myWiki/papers/behrouz-memory-caching-rnn.md

1.6 KiB
Raw Permalink Blame History

title, created, updated, type, tags, sources
title created updated type tags sources
Memory Caching: RNNs with Growing Memory 2026-04-19 2026-04-19 paper
llm
architecture
deep-learning
raw/papers/behrouz-memory-caching-rnn-2026.md

Memory Caching: RNNs with Growing Memory

arXiv: 2602.24281 [cs.LG] · 2026-02-27 作者: behrouz-memory-caching-rnn, Zeman Li, Yuan Deng, Peilin Zhong, behrouz-memory-caching-rnn, behrouz-memory-caching-rnn

核心贡献

提出 Memory Caching (MC) 技术,通过缓存 RNN 隐藏状态的检查点,使 RNN 的有效记忆容量随序列长度增长。这一技术在 RNN 的固定记忆 O(L) 和 Transformer 的增长记忆 O(L^2) 之间提供了一个灵活的插值权衡。

关键发现

  • RNN 在回忆密集型任务中表现不佳的原因通常归因于固定大小的记忆
  • MC 通过缓存隐藏状态的检查点,允许 RNN 有效记忆容量增长
  • 提出四种 MC 变体:包括门控聚合和稀疏选择机制
  • 适用于线性和深层记忆模块
  • 实验结果MC 提升了 RNN 在语言建模和长上下文理解任务上的性能
  • 在上下文回忆任务中MC 变体表现接近 Transformer优于当前最优 RNN 模型

复杂度分析

模型类型 记忆复杂度 记忆特性
传统 RNN O(L) 固定大小记忆
Transformer O(L^2) 随上下文增长
MC-RNN O(L) ~ O(L^2) 可调节的灵活插值

相关概念

来源