20260514:增加新内容

This commit is contained in:
2026-05-14 13:54:52 +08:00
parent 56c4d3ef7c
commit b116710e4c
294 changed files with 10682 additions and 255 deletions

310
log.md
View File

@@ -5,6 +5,43 @@
> 操作类型ingest, update, query, lint, create, archive, delete
> 当此文件超过 500 条记录时,轮换:重命名为 log-YYYY.md重新开始。
## 2026-05-12 — ingest | TBA (arXiv:2503.18929, NeurIPS 2025)
- 添加论文 [[bartoldson-tba-2025]]: "Trajectory Balance with Asynchrony" — GFlowNet TB 目标 × 异步分布式 RL
- 新增 8 个概念页: [[tba]], [[trajectory-balance-objective]], [[asynchronous-rl-llm]], [[off-policy-llm-post-training]], [[gflownet-fine-tuning]], [[replay-buffer-rl-llm]], [[searcher-trainer-decoupling]], [[reward-recency-sampling]]
- 核心创新: 利用 TB 目标的 off-policy 兼容性,实现 Searcher-Trainer 解耦4×50× 训练加速
- TBA 在高度 off-policy 设置下超越 Dr. GRPOMATH, Qwen 2.5 7B
- 来源: https://arxiv.org/abs/2503.18929 | 代码: https://github.com/bbartoldson/TBA
## 2026-05-12 — ingest | MathForge (arXiv:2601.20614, ICLR 2026)
- 添加论文 [[dai-mathforge-2026]]: "Harder Is Better" — 难度感知 GRPO + 多维度问题改写
- 新增 8 个概念页: [[grpo]], [[mathforge]], [[dgpo]], [[dgae]], [[dqw]], [[mqr]], [[update-magnitude-imbalance]], [[math-question-reformulation]]
- 核心发现: GRPO 存在更新幅度难度不平衡 (Theorem 1), DGAE 用 MAD 替代 std 解决 (Theorem 2)
- MQR 三维改写策略: Background (99%), Term (97%), Sub-Problem (97%) 答案保持率
- 来源: https://arxiv.org/abs/2601.20614 | 代码: https://github.com/AMAP-ML/MathForge
## [2026-05-14] ingest | StreamingLLM: 基于注意力汇的高效流式语言模型 (arXiv:2309.17453, ICLR 2024)
- 添加论文 [[streaming-llm]]: "Efficient Streaming Language Models with Attention Sinks" — 发现 Attention Sink 现象,提出无需微调的无限长流式推理框架
- 新增 5 个概念页: [[length-extrapolation]], [[rolling-kv-cache]], [[sink-token]], [[softmax-off-by-one]], [[window-attention]]
- 更新概念 [[attention-sinks]]: 从占位符扩展为完整内容(含数学推导、实验证据、应用)
- 来源: https://arxiv.org/abs/2309.17453
- 创建 5 个作者实体页: [[guangxuan-xiao]], [[yuandong-tian]], [[beidi-chen]], [[song-han]], [[mike-lewis]]
## [2026-05-14] ingest | LLMs Corrupt Your Documents When You Delegate (arXiv:2604.15597, April 2026)
- 添加论文 [[laban-llms-corrupt-documents-delegate]]: "LLMs Corrupt Your Documents When You Delegate" — DELEGATE-52 基准揭示LLM在委托工作中静默破坏文档
- 新增 11 个概念页: [[delegate-52]], [[backtranslation-round-trip-relay]], [[round-trip-reconstruction-score]], [[document-degradation]], [[critical-failures]], [[delegated-work]], [[long-horizon-evaluation]], [[semantic-equivalence]], [[domain-specific-evaluation]], [[distractor-context]], [[jagged-frontier]]
- 来源: https://arxiv.org/abs/2604.15597
## [2026-05-13] — ingest | ELF: Embedded Language Flows (arXiv:2605.10938, Tech Report 2026)
- 添加论文 [[elf-embedded-language-flows]]: "ELF: Embedded Language Flows" — 基于 Flow Matching 的连续嵌入语言扩散模型,用共享权重网络实现去噪-解码统一105M 超越 170M 基线
- 新增 11 个概念页: [[embedded-language-flows]], [[flow-matching]], [[continuous-diffusion-language-models]], [[shared-weight-discretization]], [[classifier-free-guidance-language]], [[self-conditioning]], [[x-prediction-parameterization]], [[rectified-flows]], [[sde-sampler-language]], [[generative-perplexity]], [[discrete-diffusion-language-models]]
- 来源: https://arxiv.org/abs/2605.10938
- 作者: Keya Hu*, Linlu Qiu*, Yiyang Lu, Hanhong Zhao, Tianhong Li, Yoon Kim, Jacob Andreas, Kaiming He (MIT)
## [2026-04-27] ingest | DeepSeek-V4 技术报告 (HuggingFace)
- 来源https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
- 作者DeepSeek-AI
@@ -208,6 +245,8 @@
---
---
## 2026-04-28 | 哥德尔不完备定理教程
- **来源**: PDF 直接提交 (godel_tutorial.pdf)2026年4月综合教程
@@ -272,4 +311,275 @@
- 更新 index.md总页面数 96 → 116
- 关键概念:注意力机制演化谱系 (MHA→MQA→GQA→MLA)、FlashAttention、注意力退化、KV缓存瓶颈、Lost in the Middle
- 网络连接:与已有概念 CSA、HCA、混合注意力架构、DeepSeek-V4 等形成密集交叉引用
## [2026-04-29] ingest | GPT-Image-2 绘图 Prompt 方法论与风格合集
- 来源linux.do 论坛 (sallyn)https://linux.do/t/topic/2044964
- 类型:论坛教程/经验分享 (2026-04-24),整理于 2026-04-28
- 新增文件 (11 个)
- `raw/articles/sallyn-gpt-image2-prompt-collection-2026.md` — 原始摘录存档
- `articles/gpt-image2-prompt-collection.md` — 文章主页面
- Tier 1 核心概念 (3 个)
- `concepts/gpt-image2.md` — GPT-Image-2 图像生成工具
- `concepts/prompt-reverse-engineering.md` — 图片反推 Prompt15维分析框架
- `concepts/image-generation-prompt-design.md` — 图像生成 Prompt 设计方法论
- Tier 2 风格概念 (6 个)
- `concepts/russian-constructivism.md` — 俄国构成主义
- `concepts/glitch-art-style.md` — 故障艺术
- `concepts/cel-shading-style.md` — 赛璐璐风格
- `concepts/risograph-print-style.md` — Riso印刷风格
- `concepts/halftone-print-style.md` — 半调印刷风格
- `concepts/klein-blue.md` — 克莱因蓝
- 更新 index.md总页面数 116 → 126
- 关键概念GPT-Image-2、Prompt反推工程、15维美学分析框架、5种核心艺术风格
- 特色:首次将 AI 图像生成工具链和艺术风格概念纳入 wiki 知识网络
## [2026-04-29] ingest | Caddy 反向代理认证方案
- 来源:用户直接上传 TXT
- 类型:技术教程/配置指南
- 新增文件 (6 个)
- `raw/articles/caddy-reverse-proxy-auth-2026.md` — 原始文档存档
- `articles/caddy-reverse-proxy-auth.md` — 文章主页面
- 概念 (4 个)
- `concepts/caddy-web-server.md` — Caddy Web 服务器
- `concepts/reverse-proxy-authentication.md` — 反向代理层认证模式
- `concepts/api-key-authentication.md` — API Key 认证机制
- `concepts/forward-authentication.md` — 外部委托认证模式
- 更新 index.md总页面数 126 → 131
- 关键概念命名匹配器、反向代理认证、API Key 白名单、forward_auth 委托
- 特色:首次将 Web 服务器/反向代理/认证基础设施概念纳入 wiki
## [2026-04-29] ingest | How Far Can Unsupervised RLVR Scale LLM Training? (arXiv:2603.08660)
- 来源arXiv API (2603.08660)
- 作者He, Zuo, Liu et al. (22 authors, Tsinghua/Shanghai AI Lab et al.)
- 会议ICLR 2026
- PDF7121 行文本提取
- 新增文件 (13 个)
- `raw/papers/he-urlvr-sharpening-2026.md` — 原始存档
- `papers/he-urlvr-sharpening-2026.md` — 论文主页面
- Tier 1 核心概念 (4 个)
- `concepts/unsupervised-rlvr.md` — URLVR 范式定义
- `concepts/intrinsic-rewards-sharpening.md` — Sharpening 统一理论
- `concepts/model-collapse-step.md` — MCS 模型崩溃步
- `concepts/self-verification-rewards.md` — 自我验证外部奖励
- Tier 2 基础概念 (4 个)
- `concepts/reward-hacking-llm.md` — 奖励黑客与模型崩溃
- `concepts/certainty-based-rewards.md` — 确定性奖励
- `concepts/ensemble-based-rewards.md` — 集成奖励/多数投票
- `concepts/generation-verification-asymmetry.md` — 生成-验证不对称性
- Tier 3 占位概念 (3 个)
- `concepts/rlvr-unified-framework.md` — RLVR 统一框架
- `concepts/test-time-training-rl.md` — 测试时训练 RL
- `concepts/confidence-correctness-alignment.md` — 置信度-正确性对齐
- 更新 index.md总页面数 131 → 143
- 关键概念URLVR、Sharpening机制、Rise-then-Fall模式、Model Collapse Step、Self-verification突破
- 特色:首次将 RLVR/URLVR/奖励黑客等 LLM 后训练理论概念纳入 wiki
---
## 2026-04-30 20:08 — Thinking with Visual Primitives (DeepSeek-AI, 2026)
**来源**: GitHub (deepseek-ai/Thinking-with-Visual-Primitives)
**类型**: 技术报告 / 研究论文
**领域**: Multimodal AI / Visual Reasoning
### 新增页面 (21)
- **Papers**: [[thinking-with-visual-primitives]] — 视觉原语思考框架主页面
- **Raw**: raw/papers/deepseek-visual-primitives-2026.md
### 新增概念 (20)
- [[visual-primitives]] — 视觉原语:框+点作为思维最小单位
- [[reference-gap]] — 引用鸿沟:语言空间指代模糊
- [[perception-gap]] — 感知鸿沟:分辨率限制的视觉细节丢失
- [[chain-of-thought]] — 思维链 (CoT) 的多模态扩展
- [[multimodal-large-language-model]] — MLLM 背景概念
- [[system-2-thinking]] — System 2 思维与视觉推理
- [[deepseek-vit]] — DeepSeek 视觉 Transformer
- [[deepseek-v4-flash]] — 语言骨干模型
- [[token-efficiency]] — Token 效率 (7056× 压缩)
- [[coarse-grained-counting]] — 粗粒度计数
- [[fine-grained-counting]] — 细粒度计数
- [[maze-navigation]] — 迷宫导航
- [[path-tracing]] — 路径追踪
- [[group-relative-policy-optimization]] — GRPO 算法
- [[specialized-sft]] — 专项监督微调
- [[specialized-rl]] — 专项强化学习
- [[unified-rft]] — 统一拒绝采样微调
- [[exponential-decay-reward]] — 指数衰减奖励
- [[bidirectional-trajectory-evaluation]] — 双向轨迹评估
- [[reward-model]] — 奖励模型体系
### 交叉链接
与已有概念 [[compressed-sparse-attention]]、[[on-policy-distillation]]、[[mixture-of-experts]]、[[deepseek-v4-million-token-context]] 建立双向链接。
### Wiki 规模
143 → 164 页
## [2026-05-01] ingest | CL-Bench Life: 真实生活上下文学习基准
- **来源**arXiv:2604.27043 [cs.CL]
- **作者**Hunyuan Team (Tencent) & Fudan University
- **日期**2026-04-29
- **PDF**4.9MB,提取 3879 行文本
- **新增文件 (10 个)**
- `raw/papers/hunyuan-team-cl-bench-life-2026.md` — 原始论文存档
- `papers/hunyuan-team-cl-bench-life.md` — 论文主页面
- Tier 1 核心概念 (3 个)
- `concepts/cl-bench-life.md` — CL-bench Life 基准设计
- `concepts/real-life-context-learning.md` — 真实生活上下文学习能力
- `concepts/context-misuse.md` — 上下文误用:首要失败模式
- Tier 2 基础概念 (1 个)
- `concepts/messy-context-reasoning.md` — 混乱上下文推理
- Tier 2/3 占位概念 (4 个)
- `concepts/context-learning.md` — 通用上下文学习
- `concepts/llm-evaluation-benchmarks.md` — LLM 评测基准体系
- `concepts/long-context-understanding.md` — 长上下文理解
- `concepts/identity-reference-resolution.md` — 身份指代消解
- **更新 index.md**:总页面数 164 → 173
- **关键概念**真实生活上下文学习、CL-bench Life、上下文误用76-84%错误)、混乱上下文推理、三大上下文类别
- **核心发现**:最佳模型仅 19.3% 解决率;上下文误用是首要失败模式;长上下文能力与混乱上下文推理不等价
## [2026-05-01] lint | Wiki 全面健康检查与大修
- **检查范围**181 个 wiki 页面
- **修复前问题**462 total117 断链 + 121 索引重复 + 106 缺失 frontmatter + 18 孤儿 + 等)
- **修复操作**
1. **索引去重**732 条概念条目 → 154 条唯一26 条论文 → 15 条唯一,文件从 810 行压缩到 198 行
2. **断链清零**117 → 0批量修复中文 wikilink 目标错误ClawLess 系列、Tao/Klowden 系列等)
3. **缺失索引条目**:补回 5 个概念 + 4 篇文章 + 清理 2 个坏条目
4. **Frontmatter 补全**106 → 0全量补充 YAML frontmatter
5. **孤儿概念链接**3 个 URLVR 相关概念加回 inbound link
6. **文件移动**entities/papers/tao-klowden-ai-mathematical-methods.md → papers/
- **修复后状态**
- 断链0 ✅
- 缺失 frontmatter0 ✅
- 索引条目173声明总数181差值 8 为 reviews/extracts
- 孤儿7全部为 reviews/extracts有意设计
- 页面数不变181
## [2026-05-01] ingest | Agent网络三层分类法综述
- **来源**TechRxiv (DOI: 10.36227/techrxiv.177127384.46731320/v1)
- **作者**Xinyuan Song (Emory), Qingsong Wen (Oxford), Shirui Pan (Griffith), Liang Zhao (Emory)
- **日期**2026-02-16
- **PDF**:用户直接上传,提取 2084 行文本
- **新增文件 (9 个)**
- `raw/papers/song-agent-network-taxonomy-2026.md` — 原始论文存档
- `papers/song-agent-network-taxonomy.md` — 论文主页面
- Tier 1 核心概念 (4 个)
- `concepts/agent-network-taxonomy.md` — 三层级分类法
- `concepts/agent-network-topology.md` — 拓扑维度集中式vs去中心化
- `concepts/agent-network-memory-scope.md` — 记忆范围维度全局vs局部
- `concepts/agent-network-update-behavior.md` — 更新行为维度静态vs动态
- Tier 2 基础概念 (3 个)
- `concepts/centralized-agent-architecture.md` — 集中式架构详解
- `concepts/decentralized-agent-architecture.md` — 去中心化架构详解
- `concepts/agent-communication-stack.md` — 三层通信协议栈
- **交叉链接**:与 [[cognitive-architecture]]、[[hyperagents]] 建立双向链接
- **更新 index.md**:总页面数 181 → 189
- **关键概念**Agent网络三层分类法、8种系统类别、通信协议栈、MCP标准化
- **核心贡献**:嵌套式分类框架(A=(V,E,M,Π))→8种类别识别语义层为大规模系统首要失败点
## [2026-05-01] ingest | CL-bench: 首个上下文学习基准
- **来源**arXiv:2602.03587 [cs.CL]
- **作者**Shihan Dou, Ming Zhang, Zhangyue Yin et al. (27 authors, Fudan Univ. & Tencent Hunyuan)
- **日期**2026-02-03
- **PDF**1.8MB,提取 6713 行文本
- **新增/更新文件 (7 个)**
- `raw/papers/dou-cl-bench-2026.md` — 原始论文存档
- `papers/dou-cl-bench.md` — 论文主页面
- `concepts/context-learning.md` — 从占位页升级为完整概念页
- Tier 1 类别概念 (4 个)
- `concepts/domain-knowledge-reasoning.md` — 领域知识推理7子类
- `concepts/rule-system-application.md` — 规则系统应用5子类
- `concepts/procedural-task-execution.md` — 程序性任务执行3子类
- `concepts/empirical-discovery-simulation.md` — 经验发现与模拟3子类
- **更新 index.md**:总页面数 189 → 195
- **关键概念**Context Learning 范式定义、CL-bench 四类别框架、污染防护设计
- **核心发现**:十模型平均 17.2%/最佳 23.7%;归纳推理(经验发现)是最瓶颈;法律推理 >40% vs 数学形式化 <15%
- **与已有概念的连接** [[cl-bench-life]]、[[real-life-context-learning]]、[[context-misuse]] 形成 CL-bench 系列完整知识网络
## [2026-05-11] ingest | Prompt Caching 架构工程手册 (微信公众号)
- 来源https://mp.weixin.qq.com/s/gyd4cqxadv3YW5Fe09r95g
- 类型工程实践教程 (Article)
- 案例系统Meta-JCTrader高频交易 + RL + Meta-Learning
- 新增文件 (15 )
- `raw/articles/prompt-caching-architecture-2026.md` 原始文章存档
- `articles/prompt-caching-architecture.md` 文章主页面
- 核心概念 (12 )
- `concepts/prompt-caching.md` Prompt Caching
- `concepts/prefix-matching.md` 前缀匹配
- `concepts/prompt-layering.md` 提示分层 (Global/Project/Session/Dynamic)
- `concepts/stub-pattern.md` Stub 模式轻量化桩
- `concepts/tool-registry.md` ToolRegistry 统一接口
- `concepts/cache-safe-forking.md` 缓存安全分叉
- `concepts/cache-invalidation.md` 缓存失效
- `concepts/cache-hit-ratio.md` 缓存命中率 (CHR)
- `concepts/context-compression.md` 上下文压缩
- `concepts/system-message-abuse.md` System Message 滥用反模式
- `concepts/cache-health-observability.md` 缓存健康度可观测性
- `concepts/meta-jctrader.md` Meta-JCTrader 案例
- 占位符概念 (2 )
- `concepts/agentic-systems.md` Agentic Systems
- `concepts/reinforcement-learning-trading.md` 强化学习交易
- 索引195 203 全量重建
- 关键概念四层架构分层Stub模式/ToolRegistryCache-Safe ForkingCHR监控
- Review: `reviews/prompt-caching-architecture-review-20260511.md`
## [2026-05-11] ingest | 拉姆齐数的数学综述 (用户上传)
- 来源用户上传 Markdown (RNS.md)
- 日期2025年6月
- 类型数学综述 (Survey)
- 新增文件 (18 )
- `raw/papers/ramsey-numbers-survey-2025.md` 原始综述存档
- `papers/ramsey-numbers-survey.md` 论文主页面
- 核心概念 (12 )
- `concepts/ramsey-theory.md` 拉姆齐理论
- `concepts/ramsey-numbers.md` 拉姆齐数
- `concepts/diagonal-ramsey-number.md` 对角拉姆齐数
- `concepts/probabilistic-method.md` 概率方法 (Erdős 1947)
- `concepts/hypergraph-ramsey-number.md` 超图拉姆齐数
- `concepts/geometric-ramsey-theory.md` 几何拉姆齐理论
- `concepts/additive-combinatorics.md` 加法组合学
- `concepts/van-der-waerden-theorem.md` van der Waerden 定理
- `concepts/paris-harrington-theorem.md` 巴黎-哈灵顿定理
- `concepts/green-tao-theorem.md` Green-Tao 定理 (素数等差数列)
- `concepts/szemerédi-regularity-lemma.md` Szemerédi 正则性引理
- `concepts/ramsey-theory-applications.md` 拉姆齐理论跨学科应用
- 占位符概念 (4 )
- `concepts/paley-graph.md` Paley
- `concepts/lovasz-local-lemma.md` Lovász 局部引理
- `concepts/random-graph-theory.md` 随机图理论
- `concepts/furstenberg-correspondence.md` Furstenberg 对应原理
- 索引203 219 全量重建
- 关键概念Ramsey 理论核心信条概率方法Green-Tao 定理Paris-Harrington 不可判定性
- Review: `reviews/ramsey-numbers-survey-review-20260511.md`
- 与已有概念的连接[[godel-incompleteness-theorems]] (via Paris-Harrington)
## [2026-05-11] ingest | 上下文构造与拉姆齐数 (用户上传)
- 来源用户上传 Markdown
- 类型方法论设计 (Methodology)
- 核心思路将拉姆齐理论的"必然涌现的秩序"映射到 Agent 上下文构筑
- 新增文件 (7 )
- `raw/articles/ramsey-context-construction-2026.md` 原始文档存档
- `articles/ramsey-context-construction.md` 方法论主页面
- 核心概念 (5 )
- `concepts/ramsey-context-graph.md` 拉姆齐上下文图/红边兼容性建模
- `concepts/ramsey-context-cache.md` 拉姆齐上下文缓存三层机制
- `concepts/context-blue-clique.md` 上下文蓝色团全兼容骨架
- `concepts/greedy-context-screening.md` 贪心上下文筛选三步快速组装
- `concepts/ramsey-context-template.md` 拉姆齐上下文模板KV cache 优化
- 索引219 225 全量重建
- 关键概念兼容图建模R(3,3)=6 保证蓝色团模板贪心团搜索
- Review: `reviews/ramsey-context-construction-review-20260511.md`
- 桥梁作用连接 [[ramsey-theory|拉姆齐理论]]数学 [[prompt-caching|Prompt Caching]]工程
## [2026-05-11] ingest | Koopa: Koopman 预测器驱动的非平稳时序学习 (arXiv)
- 来源https://arxiv.org/abs/2305.18803
- 作者Yong Liu, Chenyu Li, Jianmin Wang, Mingsheng Long (Tsinghua)
- 会议NeurIPS 2023
- 新增文件 (9 )
- `raw/papers/liu-koopa-2023.md` 原始论文存档
- `papers/liu-koopa-2023.md` 论文主页面
- 核心概念 (7 )
- `concepts/koopman-theory.md` Koopman 理论非线性线性映射
- `concepts/koopman-predictor.md` Koopman 预测器
- `concepts/fourier-filter-dynamics.md` Fourier Filter 动力学分解
- `concepts/dynamic-mode-decomposition.md` DMD 动态模式分解
- `concepts/non-stationary-time-series.md` 非平稳时间序列
- `concepts/koopman-autoencoder.md` Koopman 自编码器 (KAE)
- `concepts/time-variant-dynamics.md` 时变动力学
- 索引225 233 全量重建
- 关键结果SOTA 竞争性能 + 77.3% 训练时间节省 + 76.0% 内存节省
- Review: `reviews/koopa-review-20260511.md`