20260617:目前有914 页

2026-06-17 15:02:40 +08:00
parent e96b955fda
commit 91fac5b6fc
423 changed files with 20687 additions and 34 deletions
--- a/log.md
+++ b/log.md
@@ -5,6 +5,104 @@
 > 操作类型：ingest, update, query, lint, create, archive, delete
 > 当此文件超过 500 条记录时，轮换：重命名为 log-YYYY.md，重新开始。

+## [2026-06-17] ingest | Uncertainty Estimation and Generalization Bounds for Modern Deep Learning (PhD Thesis, arXiv:2606.13818, cs.LG 2026)
+- 添加论文 [[ortega-phd-thesis]]: "Uncertainty Estimation and Generalization Bounds" — PhD论文，DVIP + VaLLA + FMGP + PAC-Chernoff泛化界
+- 新增 10 个概念页: [[deep-variational-implicit-process|DVIP]], [[variational-linearized-laplace-approximation|VaLLA]], [[fixed-mean-gaussian-process|FMGP]], [[pac-bayesian-bounds|PAC-Bayesian界]], [[implicit-processes|隐式过程]], [[function-space-modeling|函数空间建模]], [[generalization-bounds|泛化界]], [[double-descent|双下降]], [[deep-gaussian-process|深度GP]], [[gaussian-process|GP]]
+- UAM 博士论文，统一 Bayesian 方法 + PAC-Bayesian 理论 + 大偏差分析
+- 来源: https://arxiv.org/abs/2606.13818
+
+## [2026-06-17] ingest | Learning to Adapt: Representation-Based RL for Multi-Task Skill Transfer (arXiv:2606.12890, cs.RO 2026)
+- 添加论文 [[repmt-sac]]: "RepMT-SAC" — 谱 MDP 分解 + 上游-下游两阶段学习的多任务 SAC，四旋翼跟踪 +30%
+- 新增 8 个概念页: [[rep-mt-sac|RepMT-SAC]], [[spectral-mdp-decomposition|谱MDP分解]], [[task-invariant-representation|任务不变表征]], [[task-conditioned-policy|任务条件策略]], [[quadrotor-trajectory-following|四旋翼轨迹跟踪]], [[upstream-downstream-learning|上游-下游学习]], [[soft-actor-critic|SAC]], [[task-distribution|任务分布]]
+- Harvard SEAS + MIT，IsaacSim 验证，零样本 ID + 少样本 OOD
+- 来源: https://arxiv.org/abs/2606.12890
+
+## [2026-06-17] ingest | Weighted Universal Approximation of Differentiable Maps on Infinite-Dimensional Manifolds (arXiv:2606.09820, math.FA 2026)
+- 添加论文 [[weighted-uat-manifolds]]: "Weighted UAT" — 无限维流形上 FNN 的加权通用逼近，含导数
+- 新增 8 个概念页: [[functional-input-neural-networks|FNN]], [[universal-approximation-theorem|UAT]], [[nachbin-theorem|Nachbin定理]], [[weighted-spaces|加权空间]], [[infinite-dimensional-manifolds|无限维流形]], [[bastiani-calculus|Bastiani微积分]], [[non-anticipative-functionals|非预期泛函]], [[signature|签名(Signature)]]
+- 77页 math.FA 核心论文，首次将 UAT 从紧集扩展到加权非紧空间并包含导数逼近
+- 来源: https://arxiv.org/abs/2606.09820
+
+## [2026-06-17] ingest | Bellman–Taylor Score Decoding for MDPs with State-Dependent Feasible Action Sets (arXiv:2606.10979, cs.AI 2026)
+- 添加论文 [[bellman-taylor-score-decoding]]: "Bellman–Taylor Score Decoding" — Taylor 展开 Q 函数将约束 MDP 映射为潜在得分 MDP，标准 DRL 直接可用
+- 新增 8 个概念页: [[bellman-taylor-score-decoding|BTSD框架]], [[latent-score-mdp|潜在得分MDP]], [[state-dependent-feasible-action-sets|状态依赖可行动作集]], [[action-decoder|动作解码器]], [[post-action-configuration|后动作配置]], [[taylor-expansion-q-function|Q函数Taylor展开]], [[queueing-network-control|排队网络控制]], [[btsd-ppo|BTSD-PPO]], [[continuation-value-function|延续价值函数]]
+- HKUST IEDA，排队网络控制验证，不需求导解码器，性能保证可分解为近似误差+学习误差
+- 来源: https://arxiv.org/abs/2606.10979
+
+## [2026-06-17] ingest | A Geometric View for Understanding Concept Learning and Neuron Interpretation in Sparse Autoencoders (arXiv:2606.07007, cs.LG 2026)
+- 添加论文 [[geometric-sae-concepts]]: "A Geometric View" — SAE 概念学习与神经元解释的统一几何框架，集合论 + 形式概念分析
+- 新增 12 个概念页: [[sparse-autoencoder|SAE]], [[polysemanticity|多义性/单义性]], [[mechanistic-interpretability|机制可解释性]], [[formal-concept-analysis|FCA]], [[concept-learning|概念学习(几何)]], [[feature-splitting|特征分裂]], [[feature-absorption|特征吸收]], [[feature-family|特征家族]], [[absolute-gating|绝对/相对门控]], [[hyperplane-arrangements|超平面排列]], [[concept-lattice|概念格]], [[superposition|叠加]]
+- UW Paul G. Allen School，区分 concept detection / separation / approximation 三层学习，建立概念格组织多对多关系
+- 来源: https://arxiv.org/abs/2606.07007
+
+## [2026-06-17] ingest | From Ticks to Flows: Dynamics of Neural RL in Continuous Environments (ICLR 2026, arXiv:2606.04275, cs.LG)
+- 添加论文 [[ticks-to-flows]]: "From Ticks to Flows" — 连续时间 RL 的双时间尺度理论分析，SDE + NTK + 鞅 CLT
+- 新增 12 个概念页: [[continuous-time-rl|连续时间RL]], [[stochastic-differential-equation|SDE]], [[wiener-process|维纳过程]], [[ito-calculus|Itô微积分]], [[two-time-scale-process|双时间尺度过程]], [[exploratory-dynamics|探索动力学]], [[linearized-neural-network|线性化NN]], [[infinite-width-limit|无限宽度极限]], [[neural-tangent-kernel|NTK]], [[martingale-clt|鞅CLT]], [[linear-quadratic-regulator|LQR]], [[control-affine-mdp|控制仿射MDP]]
+- ICLR 2026 接收，Brown University，首次给出连续 RL 中 NN 参数梯度更新的状态分布演化方程
+- 来源: https://arxiv.org/abs/2606.04275
+
+## [2026-06-17] ingest | TARPO: Token-Wise Latent-Explicit Reasoning via Action-Routing Policy Optimization (arXiv:2606.05859, cs.CL 2026)
+- 添加论文 [[tarpo]]: "TARPO" — 纯 RL 驱动的逐 token 潜在-显式混合推理框架，自适应 hard/soft 切换
+- 新增 12 个概念页: [[latent-reasoning|潜在推理]], [[coconut|COCONUT]], [[soft-token]], [[hard-token]], [[hybrid-reasoning|混合推理]], [[hrpo|HRPO]], [[token-wise-routing|逐token路由]], [[action-routing-policy|动作路由策略]], [[action-head-router|动作头路由器]], [[reparameterization-exploration|重参数化探索]], [[gumbel-softmax|Gumbel-Softmax]], [[continuous-representation|连续表征]]
+- 来自南开大学 TMCC，Qwen2.5 (1.5B-7B) 和 Llama-3.1-8B 验证
+- 来源: https://arxiv.org/abs/2606.05859
+
+## [2026-06-16] ingest | Advances in Temporal Point Processes: Bayesian, Neural, and LLM Approaches (TMLR, 2026 OpenReview: SXgGKkShhT)
+- 添加论文 [[advances-temporal-point-processes-2026]]: "Advances in Temporal Point Processes" — TPP 综述，首篇同时覆盖 Bayesian/Neural/LLM 三大范式
+- 新增 13 个概念页: [[temporal-point-process|时间点过程]], [[conditional-intensity-function|条件强度函数]], [[hawkes-process|Hawkes 过程]], [[poisson-process|泊松过程]], [[neural-temporal-point-process|神经 TPP]], [[bayesian-nonparametric-tpp|贝叶斯非参数 TPP]], [[llm-based-temporal-point-process|LLM TPP]], [[marked-temporal-point-process|标记 TPP]], [[granger-causality-tpp|Granger 因果发现]], [[intensity-free-modeling|Intensity-free 建模]], [[diffusion-based-tpp|扩散 TPP]], [[tpp-training-methods|TPP 训练方法]], [[tpp-applications|TPP 应用场景]]
+- 全新领域：时间点过程——此前 wiki 未覆盖
+- 来源: https://openreview.net/forum?id=SXgGKkShhT
+
+## [2026-06-15] ingest | Claw-SWE-Bench: A Benchmark for Evaluating OpenClaw-style Agent Harnesses on Coding Tasks (arXiv:2606.12344, cs.LG/cs.CL 2026)
+- 添加论文 [[claw-swe-bench]]: "Claw-SWE-Bench" — 将 agent harness 作为受控实验变量的多语言 SWE-bench 风格评测，附代价感知的 Pareto 前沿分析
+- 新增 11 个概念页: [[agent-harness|Agent Harness]], [[adapter-protocol|Adapter Protocol]], [[bare-adapter|Bare Adapter]], [[claw-swe-bench-lite|Claw-SWE-Bench Lite]], [[cost-aware-benchmarking|Cost-Aware Benchmarking]], [[future-commit-cleanup|Future-Commit Cleanup]], [[harness-model-interaction|Harness-Model Interaction]], [[openclaw|OpenClaw]], [[pareto-frontier-evaluation|Pareto Frontier Evaluation]], [[patch-based-evaluation|Patch-Based Evaluation]], [[swe-bench|SWE-bench]]
+- 关键发现: adapter 设计从 19.1% → 73.4% Pass@1；Harness 选择产生至多 27.4 pp 差距；准确率相似时代价可差 170 倍
+- 来源: https://arxiv.org/abs/2606.12344
+
+## [2026-06-14] ingest | 金融行业大模型落地实践：从知识工程到后训练部署 (DataFun, 王元/奇富科技, 2026 DA 上海站)
+- 添加文章 [[qifu-llm-finance-practice]]: "金融行业大模型落地实践" — 通用大模型 + 高质量知识工程的金融落地范式
+- 新增 10 个概念页: [[reer-reverse-knowledge-extraction]], [[multi-dimensional-synthetic-data]], [[post-hoc-reasoning-rl]], [[pre-hoc-reasoning-rl]], [[emotional-value-evaluation]], [[moe-lora-toolchain-conflict]], [[zero-data-cold-start]], [[vertical-llm-knowledge-engineering]], [[automatic-prompt-optimization]]
+- 来源: https://mp.weixin.qq.com/s/UnA-OLSc0mVqe7KyBX7yJw
+
+## [2026-06-14] ingest | From Procedural Skills to Strategy Genes: Towards Experience-Driven Test-Time Evolution (arXiv:2604.15097v2, cs.SE/cs.CL 2026)
+- 添加论文 [[procedural-skills-to-strategy-genes]]: "From Procedural Skills to Strategy Genes" — 经验表示层面对比分析：文档导向 Skill vs 控制导向 Gene
+- 新增 12 个概念页: [[strategy-gene]], [[procedural-skill]], [[gene-evolution-protocol]], [[test-time-control]], [[experience-representation]], [[skill-probe]], [[gene-probe]], [[evolution-probe]], [[experience-distillation]], [[bounded-reuse]], [[gene-bench]], [[critpt]]
+- 来源: https://arxiv.org/abs/2604.15097
+
+## [2026-06-13] ingest | Flex4DHuman: Flexible Multi-view Video Diffusion for 4D Human Reconstruction (arXiv:2606.13655, cs.CV 2026)
+- 添加论文 [[flex4dhuman]]: "Flexible Multi-view Video Diffusion for 4D Human Reconstruction" — 无显式几何先验的多视角视频扩散，仅通过相对相机位姿编码实现单目到 4D
+- 新增 11 个概念页: [[five-axis-positional-encoding]], [[se3-relative-camera-encoding]], [[prope]], [[clean-conditioning-mask]], [[three-stage-curriculum-training]], [[temporal-rollout]], [[teacher-forced-history]], [[multi-view-captioning]], [[monocular-video-to-4d]], [[4d-gaussian-splatting]], [[freetimegs]]
+- 来源: https://arxiv.org/abs/2606.13655
+
+## [2026-06-11] ingest | Life-Harness: Runtime Harness Adaptation for Deterministic LLM Agents (arXiv:2605.22166, 2026)
+- 添加论文 [[xu-life-harness]]: "Adapting the Interface, Not the Model" — 生命周期感知的 Runtime Harness 适配，四层架构在不更新模型权重下提升确定性 Agent
+- 新增 10 个概念页: [[runtime-harness-adaptation]], [[runtime-interface-adaptation]], [[lifecycle-aware-harness]], [[environment-contract-layer]], [[procedural-skill-layer]], [[action-realization-layer]], [[trajectory-regulation-layer]], [[harness-evolution]], [[cross-model-harness-transfer]], [[deterministic-agent-failures]]
+- 来源: https://arxiv.org/abs/2605.22166
+
+## [2026-06-10] ingest | Dead Directions: Geometric Singular Learning (arXiv:2606.05957, 2026)
+- 添加论文 [[dead-directions-geometric-singular-learning]]: "Dead Directions: Geometric Singular Learning" — dead direction 桥接 SLT 与信息几何，单 checkpoint 读出 Watanabe 三元组
+- 新增 8 个概念页: [[dead-direction]], [[singular-learning-theory]], [[information-geometry]], [[fisher-information-metric]], [[real-log-canonical-threshold]], [[kl-order]], [[watanabe-triple]], [[ddcadam]]
+- 来源: https://arxiv.org/abs/2606.05957
+
+## [2026-06-10] ingest | Representation Learning Enables Scalable Multitask Deep RL (arXiv:2606.05555, 2026)
+- 添加论文 [[predictive-representations-scalable-mtrl]]: "Scalable Multitask Deep RL" — 预测表征学习（非规划）是多任务RL可扩展性的核心驱动力
+- 新增 8 个概念页: [[predictive-representation-learning]], [[mrq-algorithm]], [[multitask-rl]], [[representation-learning-rl]], [[auxiliary-predictive-objectives]], [[world-models-rl]], [[model-free-rl]], [[deep-rl-scaling]]
+- 来源: https://arxiv.org/abs/2606.05555
+
+## [2026-06-10] ingest | On the fibers and semi-algebraicity of ReLU neuromanifolds (arXiv:2606.02826, math.AG 2026)
+- 添加论文 [[relu-neuromanifolds-semi-algebraicity]]: "ReLU Neuromanifolds" — ReLU神经流形不是半代数商，引入honest开子集概念
+- 新增 8 个概念页: [[neuromanifold]], [[neuroalgebraic-geometry]], [[semi-algebraic-set]], [[honest-open-subset]], [[hidden-symmetries-neural]], [[parametrization-map]], [[scaling-permutation-symmetry]], [[fiber-of-parametrization]]
+- 来源: https://arxiv.org/abs/2606.02826
+
+## [2026-06-10] ingest | Minimax-Optimal Policy Regret in Partially Observable Markov Games (arXiv:2606.02363, ICML 2026)
+- 添加论文 [[minimax-policy-regret-pomg]]: "Minimax-Optimal Policy Regret in POMGs" — O(sqrt(T)) minimax 最优策略后悔，epoch-based 乐观 MLE 算法
+- 新增 12 个概念页: [[partially-observable-markov-game]], [[policy-regret]], [[eluder-dimension]], [[observable-operator-model]], [[posterior-lipschitz-adversary]], [[weak-revealing-condition]], [[causal-decomposition-pomg]], [[epoch-based-optimistic-mle]], [[minimax-optimality]], [[pomdp]], [[adaptive-adversary]], [[fading-memory]]
+- 来源: https://arxiv.org/abs/2606.02363
+
+## [2026-06-10] ingest | Principled Uncertainty in Clinical AI: 端到端贝叶斯建模与算法公平性审计 (arXiv:2606.09789, 2026)
+- 添加论文 [[principled-uncertainty-clinical-ai]]: "Principled Uncertainty in Clinical AI" — 端到端贝叶斯不确定性建模 + 不确定性作为公平性信号
+- 新增 12 个概念页: [[epistemic-uncertainty]], [[aleatoric-uncertainty]], [[uncertainty-quantification]], [[bayesian-deep-learning]], [[expected-calibration-error]], [[uncertainty-equity-gap]], [[uncertainty-disparity-ratio]], [[precision-weighted-fusion]], [[mc-dropout]], [[algorithmic-equity]], [[clinical-ai]], [[variational-autoencoder]]
+- 来源: https://arxiv.org/abs/2606.09789



@@ -23,6 +121,75 @@



+
+
+
+## [2026-06-10] ingest | Pydantic 三件套：从校验库到 AI 基础设施 (微信公众号, 2026)
+- 添加文章 [[pydantic-three-piece-suite]]: "Pydantic 三件套" — pydantic-core (Rust 引擎) + Logfire (OTel 可观测) + Pydantic AI (类型安全 Agent)，渐进路线图
+- 新增 9 个概念页: [[pydantic]], [[pydantic-core]], [[logfire]], [[pydantic-ai]], [[typeadapter]], [[open-telemetry]], [[structured-output]], [[drift-detection]], [[type-safety-in-agents]]
+- 更新概念: [[agent-observability|Agent 可观测性]]（追加 Logfire/漂移检测/Pydantic 三件套引用）
+- 来源: https://mp.weixin.qq.com/s/jg6lW3ObZooBsrWTGwIcRg
+
+## [2026-06-10] ingest | OneReason: 生成式推荐中的推理能力解锁 (arXiv:2606.06260, 2026)
+- 添加论文 [[onereason]]: "OneReason" — 生成式推荐推理模型，Perception-Cognition 双支柱 + R0-R3 四层推理 + Specialize-then-Unify RL
+- 新增 13 个概念页: [[onerec]], [[generative-recommendation]], [[itemic-tokens]], [[recommendation-reasoning]], [[recommendation-cot]], [[perception-cognition-recommendation]], [[onereason-bench]], [[abductive-reasoning-recommendation]], [[specialize-then-unify-rl]], [[rejection-sampling-fine-tuning]], [[multi-teacher-on-policy-distillation]], [[thinking-supervision-transfer]], [[itemic-text-alignment]]
+- 更新概念: [[chain-of-thought|思维链]]
+- 来源: https://arxiv.org/abs/2606.06260
+
+## [2026-06-08] ingest | LeWorldModel: Stable End-to-End JEPA from Pixels (arXiv:2603.19312, 2026)
+- 添加论文 [[maes-leworldmodel-2026]]: "LeWorldModel" — 首个端到端 JEPA 世界模型，15M 参数，仅 2 项损失 + 1 超参
+- 新增 1 个概念页: [[pldm]] (LeWM 对比基线)
+- 已有概念复用: [[leworldmodel]], [[jepa]], [[sigreg]], [[representation-collapse]], [[world-model-lecun]], [[abstract-representation-space]]
+- 来源: https://arxiv.org/abs/2603.19312
+
+## [2026-06-08] ingest | LeCun 论 LLM 的边界与未来架构 (Datawhale, 2026)
+- 添加文章 [[lecun-llm-boundary-future]]: "LeCun 论 LLM 的边界与未来架构" — 系统梳理 LeCun 对 LLM 未来方向的 8 大核心判断
+- 新增 14 个概念页: [[jepa]], [[world-model-lecun]], [[vla-vision-language-action]], [[objective-driven-ai]], [[representation-collapse]], [[sigreg]], [[tapestry-federated]], [[sovereign-ai]], [[vicreg]], [[leworldmodel]], [[action-consequence-prediction]], [[multi-step-planning]], [[abstract-representation-space]], [[data-wall]]
+- 来源: https://mp.weixin.qq.com/s/Zau10ioTWzhj0KOImpasNg
+
+## [2026-06-07] ingest | 窃取无穷的数学家 (Quanta Magazine / 环球科学 2026)
+- 添加文章 [[cantor-stole-infinity]]: "窃取无穷的数学家" — 康托尔1874年论文隐藏狄德金贡献的历史真相
+- 新增 9 个概念页: [[georg-cantor]], [[richard-dedekind]], [[infinity-hierarchy]], [[countable-uncountable-infinity]], [[algebraic-numbers-countability]], [[emmy-noether]], [[leopold-kronecker]], [[mathematical-priority-disputes]], [[set-theory-history]]
+- 来源: https://mp.weixin.qq.com/s/xJwwHWAbBsS8NWiNeLbtNQ (原刊 Quanta Magazine: The Man Who Stole Infinity)
+## [2026-06-05] ingest | Stem: Rethinking Causal Information Flow in Sparse Attention (arXiv:2603.06274, 2026)
+- 添加论文 [[niu-stem-causal-sparse-attention]]: "Stem: Rethinking Causal Information Flow in Sparse Attention" — 从因果信息流视角重新思考稀疏注意力，TPD+OAM 双组件
+- 新增 4 个概念页: [[stem-sparse-attention]], [[causal-information-flow]], [[token-position-decay]], [[output-aware-metric]]
+- 来源: https://arxiv.org/abs/2603.06274
+
+## [2026-06-05] ingest | Token Economics for LLM Agents: A Dual-View Study from Computing and Economics (arXiv:2605.09104, 2026)
+- 添加论文 [[chen-token-economics-llm-agents]]: "Token Economics for LLM Agents" — 首个 Token Economics 综述, 四维分类法 (Micro/Meso/Macro/Security)
+- 新增 9 个概念页: [[token-economics]], [[token-as-economic-primitive]], [[micro-level-token-economics]], [[meso-level-token-economics]], [[macro-level-token-economics]], [[token-security-economics]], [[agent-token-budget-optimization]], [[differentiable-token-budgeting]], [[token-market-dynamics]]
+- 来源: https://arxiv.org/abs/2605.09104
+- GitHub: https://github.com/SuDIS-ZJU/Token-Economics
+
+## [2026-06-05] ingest | Auditing Agent Harness Safety (arXiv:2605.14271, 2026)
+- 添加论文 [[liu-auditing-agent-harness-safety]]: "Auditing Agent Harness Safety" — Agent 骨架安全三层审计框架
+- 新增 13 个概念页: [[agent-harness-safety]], [[harnessaudit]], [[boundary-compliance]], [[execution-fidelity]], [[system-stability]], [[trajectory-auditing]], [[multi-agent-safety]], [[information-flow-control]], [[resource-access-control]], [[safety-adherence-rate]], [[policy-constrained-execution]], [[execution-harness]], [[hidden-audit-channel]]
+- 来源: https://arxiv.org/abs/2605.14271
+
+## [2026-06-04] ingest | IntrAgent: An LLM Agent for Content-Grounded Information Retrieval through Literature Review (arXiv:2604.22861, 2026)
+- 添加论文 [[ma-intragent-2026]]: "IntrAgent" — 内容锚定的文献信息检索Agent，两阶段管道：Section Ranking + Iterative Reading，13.2% accuracy gain
+- 新增 15 个概念页: [[intraview]], [[intragent]], [[section-ranking]], [[iterative-reading]], [[hierarchy-preservation]], [[sufficiency-check]], [[intrabench]], [[content-grounded-retrieval]], [[scientific-literature-qa]], [[mineru]], [[hallucination-mitigation]], [[cross-section-synthesis]], [[content-question-answering]], [[faithfulness-in-ai]], [[pdf-processing]]
+- 来源: https://arxiv.org/abs/2604.22861
+- 代码: https://github.com/FengboMa/IntrAgent | 数据集: https://huggingface.co/datasets/IntrAgent/IntraBench
+
+## [2026-06-03] ingest | Reconciling Contradictory Views on the Effectiveness of SFT in LLMs: An Interaction Perspective (arXiv:2605.17967, 2026)
+- 添加论文 [[zhang-reconciling-sft-interaction-2026]]: "Reconciling Contradictory Views on SFT in LLMs" — 从交互视角揭示SFT两阶段动力学：极短去噪阶段+漫长过拟合阶段
+- 新增 10 个核心概念页: [[interaction-based-explanation]], [[and-or-interactions]], [[interaction-types-sft]], [[sft-denoising-stage]], [[interaction-generalizability]], [[uncancelled-interaction-effects]], [[interaction-order]], [[logical-model-interaction]], [[sft-early-stopping]], [[preserved-interactions-backbone]]
+- 新增 6 个占位符概念: [[supervised-fine-tuning]], [[rlhf]], [[dpo]], [[shapley-values]], [[catastrophic-forgetting]], [[in-context-learning]]
+- 来源: https://arxiv.org/abs/2605.17967
+## [2026-06-02] ingest | One-Pass to Reason: Token Duplication and Block-Sparse Mask for Efficient Fine-Tuning on Multi-Turn Reasoning (arXiv:2504.18246, ICML 2025 Workshop)
+- 添加论文 [[goru-one-pass-to-reason-2025]]: "One-Pass to Reason — 多轮推理的高效单遍微调" — Token复制+分块稀疏注意力掩码，将多轮推理训练从O(N³)降至O(N²)，1.05×–1.22×加速
+- 新增 8 个概念页: [[one-pass-fine-tuning]], [[token-duplication]], [[block-sparse-attention]], [[multi-turn-reasoning]], [[visibility-constraint]], [[position-id-discrepancy]], [[k-pass-training]], [[mathchatsync-reasoning]]
+- 来源: https://arxiv.org/abs/2504.18246
+- 代码: https://github.com/devrev/One-Pass-to-Reason
+
+## [2026-06-01] ingest | Why Steering Works: Toward a Unified View of Language Model Parameter Dynamics (arXiv:2602.02343, 2026)
+- 添加论文 [[xu-why-steering-works]]: "Why Steering Works — 语言模型参数动态的统一视角" — 统一动态权重更新框架，Preference-Utility 解耦分析，激活流形假说，SPLIT 联合优化方法
+- 新增 16 个概念页: [[dynamic-weight-updates]], [[preference-utility-analysis]], [[activation-manifold]], [[validity-decay]], [[steering-dynamics]], [[split-steering]], [[preference-log-odds]], [[intervention-multiplier]], [[representation-validity]], [[lora]], [[activation-steering]], [[linear-representation-hypothesis]], [[model-steering]], [[steering-vector]], [[controlled-text-generation]], [[representation-space]]
+- 来源: https://arxiv.org/abs/2602.02343
+- 代码: https://github.com/zjunlp/EasyEdit/blob/main/examples/SPLIT.md
+
 ## [2026-05-31] ingest | ToolCUA: Optimal GUI-Tool Path Orchestration (arXiv:2605.12481, 2026)
 - 添加论文 [[toolcua-optimal-gui-tool-orchestration]]: "ToolCUA: 面向CUA的最优GUI-Tool路径编排" — 通过合成数据+分阶段RL学习GUI-Tool杂交动作空间的最优切换策略
 - 新增 8 个概念页: [[computer-use-agents]], [[gui-tool-hybrid-action-space]], [[optimal-gui-tool-path-selection]], [[interleaved-gui-tool-trajectory-scaling]], [[tool-bootstrapped-rft]], [[tool-efficient-path-reward]], [[osworld-mcp]], [[next-state-grounding]]
@@ -97,19 +264,11 @@

 ## [2026-05-23] ingest | Generative Recursive Reasoning (GRAM) (arXiv:2605.19376, 2026)
 - 添加论文 [[gram-generative-recursive-reasoning-paper]]: "Generative Recursive Reasoning" — 将确定性递归推理升级为概率性多轨迹计算（Baek, Jo, Kim, Ren, Bengio, Ahn; KAIST/Mila/NYU/UdeM）
- 新增 11 个概念页: [[recursive-reasoning-models]], [[gram-generative-recursive-reasoning]], [[stochastic-latent-trajectory]], [[multi-trajectory-inference]], [[inference-time-scaling]], [[width-based-scaling]], [[latent-variable-generative-model]], [[amortized-variational-inference]], [[deep-and-wide-reasoning]], [[multi-solution-recovery]], [[unconditional-generation-latent]]
- 来源: https://arxiv.org/abs/2605.19376
- Wiki 规模: 406 → 418 页
+- 新增 11 个概念页: [[recursive-reasoning-models]], [[gram-generative-recursive-reasoning]], [[stochastic-latent-trajectory]], [[multi-trajectory-inference]], [[inference-time-scaling]], [[width-based-scaling]], [[latent-variable-generative-model]], [[amortized-variational-inference]], [[

-## [2026-05-23] ingest | Claw-Eval：面向自主Agent的端到端评测框架（ModelScope）
- 添加文章 [[claw-eval]]: "Claw-Eval" — 300 人工验证任务、Completition/Safety/Robustness 三维护评分、14 前沿模型评测
- 新增 9 个概念页: [[agent-evaluation-paradigm-shift]], [[agent-process-evaluation]], [[pass-at-k-vs-pass-k]], [[agent-safety-evaluation]], [[agent-robustness-evaluation]], [[agent-capability-stability-gap]], [[question-quality-vs-quantity]], [[agent-multidimensional-capability]], [[agent-completion-evaluation]]
- 来源: https://mp.weixin.qq.com/s/4oY35c9SmweJ4Vi0KztVOA (ModelScope 公众号)
- Wiki 规模: 396 → 406 页
+... [OUTPUT TRUNCATED - 1068 chars omitted out of 51068 total] ...

-## [2026-05-23] ingest | Agent Harness Engineering: A Survey (TMLR 2026, under review)
- 添加论文 [[agent-harness-engineering-survey]]: "Agent Harness Engineering: A Survey" — 提出 ETCLOVG 七层分类法、170+ 开源项目映射、跨层综合与五大开放问题
- 新增 21 个概念页: [[agent-harness-engineering]], [[etclovg-taxonomy]], [[execution-environment]], [[tool-interface]], [[context-management]], [[lifecycle-orchestration]], [[observability]], [[verification-evaluation]], [[governance-security]], [[cost-quality-speed-trilemma]], [[capability-control-tradeoff]], [[harness-coupling-problem]], [[binding-constraint-thesis]], [[prompt-to-harness-evolution]], [[trace-native-evaluation]], [[standard-agent-handoffs]], [[adaptive-harness-simplification]], [[hardening-execution-environments]], [[reliable-state-long-running-agents]], [[context-state-estimation]], [[agent-frameworks-to-platforms]]
+, [[lifecycle-orchestration]], [[observability]], [[verification-evaluation]], [[governance-security]], [[cost-quality-speed-trilemma]], [[capability-control-tradeoff]], [[harness-coupling-problem]], [[binding-constraint-thesis]], [[prompt-to-harness-evolution]], [[trace-native-evaluation]], [[standard-agent-handoffs]], [[adaptive-harness-simplification]], [[hardening-execution-environments]], [[reliable-state-long-running-agents]], [[context-state-estimation]], [[agent-frameworks-to-platforms]]
 - 来源: 用户上传 PDF（用户 o9cq80wQvcn_qxHaHlEso2Bn3qoU@im.wechat）
 - Wiki 规模: 373 → 395 页

@@ -231,7 +390,7 @@

 ## [2025-04-15] ingest | Mathematical methods and human thought in the age of AI
 - 来源：arXiv:2603.26524
- 作者：[[Terence Tao]], [[Tanya Klowden]]
+- 作者：[[terence-tao|Terence Tao]], [[tanya-klowden|Tanya Klowden]]
 - 保存至：raw/papers/tao-ai-mathematical-methods-2026.md
 - 创建页面：
  - entities/papers/tao-klowden-ai-mathematical-methods.md
@@ -244,7 +403,7 @@

 ## [2026-04-16] ingest | All elementary functions from a single binary operator
 - 来源：arXiv:2603.21852 [cs.SC]
- 作者：[[Andrzej Odrzywołek]]
+- 作者：[[andrzej-odrzywolek|Andrzej Odrzywołek]]
 - 保存至：raw/papers/odrzywolek-eml-single-operator-2026.md
 - 创建页面：
  - papers/odrzywolek-eml-single-operator.md — EML 算子论文摘要